This Page Is Inserted by IFW Operations 
and is not a part of the Official Record 

BEST AVAILABLE IMAGES 

Defective images within this document are accurate representations of 
the original documents submitted by the applicant. 

Defects in the images may include (but are not limited to): 

• BLACK BORDERS 

• TEXT CUT OFF AT TOP, BOTTOM OR SIDES 

• FADED TEXT 

• ILLEGIBLE TEXT 

• SKEWED/SLANTED IMAGES 

• COLORED PHOTOS 

• BLACK OR VERY BLACK AND WHITE DARK PHOTOS 

• GRAY SCALE DOCUMENTS 

IMAGES ARE BEST AVAILABLE COPY. 

As rescanning documents will not correct images, 

please do not report the images to the 

Image Problem Mailbox. 



1 % 



® BUNDESREPUBLIK 
DEUTSCHLAND 




DEUTSCHES 
PATENT- UND 
MARKENAMT 




© Offenlegungsschrift 

« DE 197 31 274 A1 



® Aktenzeichen: 
© Anmeldetag: 
@ Offenlegungstag: 



197 31 274.8 
22. 7.97 
28. 1.99 



® 



Int. CI. 6 : 

C 12 N 15/63 

C 12 N 15/70 
C12N 15/74 
C12N 15/81 
C 12 N 1/00 
C 12 N 1/21 
C 12 N 1/19 
C 12 P 17/18 
C 07 D 495/04 



CM 
CO 



@ Anmelder: 

BASF AG, 67063 Ludwigshafen, DE 



@ Erfinder: 

Schroder, Hartwig, Dr., 69226 Nufcloch, DE; Hauer, 
Bernhard, Dr., 67136 FuSgonheim, DE 



Die folgenden Angaben sind den vom Anmelder eingereiehten Unterlagen entnommen 

@ Verfahren zur Herstellung von Biotin 

(57) Die Erfindung betrifft ein Genkonstrukt enthaltend ein 
Biotingen mit der Sequenz SEQ ID No. 1 oder SEQ ID No. 
3, Organismen, die dieses Genkonstrukt enthalten, die 
Verwendung dieser Sequenzen oder des Genkonstrukts 
zur Herstellung von Biotin, sowie ein Verfahren zur Her- 
stellung von Biotin. 



CO 



BUNDESDRUCKEREI 11.98 802 064/203/1 30 



DE 197 31 274 A I 



Beschreibung 

Die Hrfindung heirifft ein Gcnkonsirukt enlhaltend cin Biolingen mil der Sequenz SEQ TO No. 1 odcr SEQ TD No. 3. 
Organismen, die dieses (Jenkonslmkl enihahen. die Verwendung dieser Sequenzen cxlcr des Genkcnslrukts zur IlersieJ- 
5 iung von Biolin, sowie ein Vcrfahrcn zur Herslcllung von Biolin. 

Als Cocnzym spick Biolin (Vitamin H) cine csscnticllc Rollc bci cnzymkatalysicrtcn Carboxylicrungs- und Dccarbox- 
ylierungsrcaktioncn. Biolin isi daniii cin csscnticllcr Faktor in Icbcndcn Zcllcn. Biolin inuB von fast alien Ticrcn und ci- 
nigen Mikroorganismen von auBen aufgcnoninicn werden, da sic Biolin nicht sclber synthctisieren konnen. Es ist daniit 
fur dicsc Organistncn ein esscntielles Vitamin. Baklericn, Hcfcn und Pflanzcn hingegen konnen Biolin aus Vorstufen 

to sclbst synthetisiercn (Brown el al. Biotechnol. Genet. Eng. Rev. 9, 1 991 : 295-326, DeMoll. II. Escherichia coli and Sal- 
monella, eds. Neidhardt, R C. el al. ASM Press, Washington DC, USA, 1996 : 704-708, ISBN 1-5558 1-084-5). 

Die Biotinsynihesc wurde in bakterieMen Organismcn spe/.icll im graninegativen Baklerium Escherichia coli und im 
grampositiven Bakteriuni Bacillus sphacricus untersuchl (Brown el al. Biotechnol. Genet. Rng. Rev. 9, 1991 : 295-326). 
Alserstcs bisher bckanntes Intermedial in E. coli wird Pimelyl-CoA (PmCoA) angesehen, das aus der Eettsaurcsynihese 

15 stamnil (DeMoll, E., Escherichia coli and Salmonella, eds. Neidhardt, R C. et al. ASM Press. Washington DC. USA, 
1996 : 704 708, ISBN 1-55581-084-5 1996). Der Synlheseweg dieser Biotin-Vorstule in R. coli ist bisher weitgehend 
unbekanni (Ifuku 1993. Lemoinc 1996). Es wurden mil bioC und bioll zwei Gene identifiziert. dercn korrcspondierende 
Protcinc fiir die Svnthesc von Pm-CoA vcraniwonlich sind. Die cnzymaiische Eunkiion der Gcnprodukic Bioll und 
BioC isi bisher nicht bekannt (Lcmoine el al.. Mol. Microbio, 19, 1996: 645-647. DeMoll, E., Rscherichia coli and Sal- 

20 monella. eds. Neidhardt. R C. et al. ASM Press, Washington DC, USA. 1996 : 704-708, ISBN 1-55581-084-5). Pm-CoA 
wird in vier weiteren enzymatischen Schritten zum Biolin unigewandelt. Ausgehend vom Pm-CoA findet zuerst die Kon- 
dcnsalion mil Alanin zu 7-Kcto-8-Amino-Pelargonsaure (KAPA) stall. Das Genprodukt fur diese Umsctzung ist BioF 
(KAPA-Synthetase). KAPA wird mil dem Kosubsirai S-Adenosyl-Methionin durch BioA (DAPA- A niinotransfera.se) zu 
7,8 Diamino-Pelargonsaure Iransaminiert. Der nachste Schrilt fiihrt nach eincr ATP-abhangigen Carboxylierungsreak- 

25 lion zum Dethiobiotin (DTB) und wird durch BioD (Dethiobiotin-Synlhase) kaialysiert. Im letzlen Schritt findet die Um- 
sctzung von DTB zu Biotin statt. Dieser Schritl wird durch BioB (Biotin-Synthelase) kalalysiert. Die fiir die beschriebe- 
nen Proleine kodierenden Gene bioF, bioA, bioD, und bioB sind in E. coli auf einem bidireklionalem Operon kodierl. 
Dieses Operon liegi zwischen der A.-altachmenl-site und dem uvrB Gen Locus bei ca. 17 Minuten auf dem E. coli Chro- 
mosom (Bcrlyn et al. 1996 : 1715-1902). Auf dicscm Operon sind zusatzlich noch zwei weitere Gene kodicru von denen 

30 das cine, bioC, bcrcits bcschriebcnc Eunktioncn in der Synihcsc von Pm-CoA hat, wahrend einem otfencn Ecscrastcr 
hinter bioA bisher kcine Runktion zugeordnet werden konnie (WO 94/8023, Otsuka el al., J. Biol. Chcm. 263, 
1 988 : 1 9577-85). IToch konscrvierte Tlomologe zu den R. coli Protcinen BioR A. D, B wurden in B. sphacricus. B. sub- 
lilis, Syneccocystis sp. (Brown et al. Biotechnol. Gcnci. Eng. Rev. 9. 1991 : 295-326, Bower et. al., J. Bacteriol. 175. 
1996 : 4122-4130, Kanekoet al., DNA Res. 3. 3, 1996 : 109-136), Archaebaktericn wie Methanococcus janaschi, Hefen 

35 wie Saccharomyces cerevisiae (Zhang el al.. Arch. Biochem. Biophys. 309, 1, 1994: 

29-35) odcr in Pflanzcn wie Arabidopsis thaliana (Baldct et al.,C. R. Acad. Sci. Ill, Sci. Vie. 319, 2, 1996 : 99-106)) ge- 
fundc-n. 

Die Synthese von Pm-CoA scheinl in den beiden bisher unlersuchlen gram-positiven Mikroorganismen anders zu ver- 
laufen a is in E. coli. Es konnten kcine Homologcn von bioM und bioC gefunden werden (Brown et al. Biotechnol. Genet. 
40 Eng. Rev. 9, 1991 : 295-326). 

Biotin ist cine optisch aktive Substanz mit drei Chiralitalszentren. Es wird bisher wirtschaftlich nur ubercine vielslu- 
fige, teurc chemische Synthesc hergcstcllt werden. 

Aliernativ zu dieser chemischen Synthese wurde cine Vielzahl von Versuchen untcrnommen, ein fermentatives Ver- 
fahrcn zur Herstcllung von Biotin mil Mikroorganismen aufzubauen. Durch Klonicrung des Biotin-Operons auf muki- 
45 copy-Plasmidc konnte die Bioiinsynthesc in den mil diesen Gencn transformicrten Mikroorganismen erhoht werden. 
Eine weitere Rrhohung der Biotinsynthese wurde durch die Dcregulicrung der Biotingenexpression iiber die Selekiion 
von birA-Mutanien erreichi (Pai C M., J. Bacteriol. 112, 1972 : 1280 1287). Die Kombination beider Ansatze, das heiBt 
die Rxpression der Plasmid-kodierten Biosynthesegene in einem regulalionsdefizienien Stamm (EP-B-0 236 429), 
brachie eine weitere Sleigerung der Produklivital. Das Biolin-Operon kann dabei entweder unter Kontrolle seines nati- 
50 ven bidireklionalem Promoiors verbleibcn (EP-B-0 236 429), odcr seine Gene konnen unter die Kontrolle eines extern 
rcgulicrbarcn Promotors gcbracht werden (WO 94/8023). 

Durch die bisher vcrfolgten Ansatze zur fcrmcniativen Herstcllung von Biotin in H. coli konnte keine wirtschaftlich 
ausreichende Produklivital erreichi werden. Es zeigtc sich, daB die Ausbeute in der fcrmcniativen Herstcllung von Biolin 
durch die unvollslandigc Umwandlung von DTB zu Biolin durch das BioB-Genprodukt (Bioiinsynthase) verursacht 
55 wird. Zcllen die Mulationen im hioB-Gen iragen, sind nicht in der Rage auf DTB zu wachsen und damit DTB in Biotin 
umzuwandeln. Der chemische und cnzymaiische Mechanismus der Umwandlung von DTB zu Biotin ist bisher nur un- 
veil si iindig verstanden und nufgeklart. 

Durch inlensive genelische Uniersuchungen konnten bisher keine weileren an der Reaktion beteiligten Proteine iden- 
lifizierl werden. Eine Charaklerisierung der Umwandlung von DTB zu Biolin wurde bisher ausschlieBlich in bakieriellen 
60 bzw. pflanzlichen Zellexlrakien durchgefuhrl (WO 94/8023. EP-B-0 449 724, Sanyal el al. Arch. Biochem. Biophys., 
Vol. 326, No. R 1996:48-56 und Biochemistry 33, 1994:3625-3631, Baldct el al. Europ. J. Biochem. 217 r 1, 
1993 : 479-485, Mcjean ci al. B iochem. Bio phygljic^^pjnmun 

Bios'ci7Bi6iechh^l7Bic^h^m.758, 9. 1 994 : 1 738- 1741). 

Diese Uniersuchungen haben gezcigl. daB nicdcrmolekularc Rakiorcn wie S-Adenosylmcthionin, NADI^H, Cysiein. 
65 Thiamin, Ec 2+ . Asparagin, Serin. l : ruktose 1-6-bisphosphat die Synthese von Biotin stimulicrcn (Ohshiro et al.. Biosci. 
Biotechnol. Biochem.. 58, 9. 1994: 1738-1741, Birch el al., J. Biol. Chem. 270. 32, 1995 : 19158-19165, Ifuk el al.. 
Biosci. Biotechnol. Biochem., 59, 2. 1995: 185-189). Ncbcn diesen nicdeniiolekularcn Raktoren wurden weitere Prote- 
ine identifizicrt, die die Synthcsc von Biolin aus DTB in Gcgcnwart von BioB stimulieren. Dabei handclt es sich um Ha- 
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vodoxin unci Flavodoxin-NADPH-Redukiase (Birch ct al., J. Biol. Chcm. 270, 32, 1995 : 19158-19165, ffuk ei at., 
Biosci. Bioicchnol. Biocheni., 59, 2, 1995 : 185-189, Sanyal ct al„ Arch. Biochem. Biophys. 326, 1, 1996 : 48-56). 

Die Biotin- und Liponsauresynlhese weisen cine groBe Homologie auf. In beiden Synihesewegen wire! aufder letzlen 
Synihcsesiufe zwischen niehl aklivierte C- Atonic ein Schwciel bzw. zwei Sehwefeiaiome inserieri. Die Synihese von Li- 
ponsaure isi bishcr nur unzurcichend charaklcrisicrl (DcMoll. E., Escherichia coli and Salmonella, eds. Neidhardt, K C. 5 
ci al. ASM Press, Washington DC, USA, 1996 : 704-708, ISBN 1-55581-084-5). Es wurden bishcr nur zwei notwendige 
Gene in E. coli idcntilizicrt: lipA und lipB. 

Bcide Gene licgen in eineni Opcron. mil cineni bisher nicht charaktcrisicnem Open Reading Frame (= ORF) zwischen 
beiden Genen. Ein wciters Gen IplA ist in der Lage Liponsaure uber ein Lipoyl-AMP-Intermedial auf Lysin zu ubertra- 
gcn. Diesc Rcaktion hat somil Ahnlichkcit mit der Akiivitat von birA. Zwischen LipA und BioB konnten durch Sequenz- to 
verglciche honiologc Bercichc in der Aminosauresequenz identifiziert werden. Diesc Umfassen unter andcrem ein Cy- 
stcin-Clustcr. F.s konnte gezcigt werden, daB T ,ipA fur den Hinbau von zwei Schwcfelatomcn in die Liponsaure kataly- 
siert (DcMoll, E., Escherichia coli and Salmonella, eds. Neidhardt, F. C. ct ai. ASM Press, Washington DC\ USA, 
1996 : 704-708, ISBN 1-55581-084-5). 

Uber die Herkunft des Schwefels im Biotinniolekul cxistieren widerspruchliche Ergebnisse. Bei Untersuchungen der 15 
Biotinsynthesc in Gcsanitzellextrakten wurde gezeigt. daB in Gegenwart von 35 S-markiertem Cystein Radioaktivitat in 
Biolin inkorporicrt wurde; wedcr mit 35 S-markiertem Methionin noch mit S-Adenosyl-Mcthionin konnte ein Schwefel- 
Einbau ins Biotinniolekul nachgcwicscn werden (Ifuku ct al., Biosci. Bioicchnol. Biochem. 59. 2, 1995 : 184-189. Birch 
et al., J. Biol. Chem. 270. 32, 1995 : 19158-19165). 

Im Gcgcnsaiz dazu stehen Untersuchungen mil gcreinigicm BioB-Protein in Gegenwart von 35 S-markiertcm Cystein 20 
und ohnc Zugabc von Zellcxtrakten. bei denen zwar cine Biotin-Synlhesc aber kcin Einbau von Radioaktivitat in das 
Biotinniolekul beobachtct werden konnte (Sanyal el al., Arch. Biochem. Biophys. 326. 1. 1996: 48-56, Mejean ct al.. 
Biochem. Biophys. Res. Commun. 2127, 3, 1995 : 1231-1237). Unter dicsen Synthesebedingungen ohne Zellexirakt- 
zugabe war die gcbildetc Biotinmcngc niedrig und entsprach maximal ca. 2 Mol Biotin/Mol BioB (Sanyal et al., Arch. 
Biochem. Biophys. 326. 1, 1996 : 48-56) bzw. 0,1 Mol Biotin/Mol BioB (Mejean et al., Biochem. Biophys. Res. Com- 25 
num. 2127, 3. 1995: 1231 1237). Nach dicsen Untersuchungen kann ein Einbau von Schwefel in Biotin erfolgen, ohne 
das Cystein als Schwefeldonor verwendel wird. Diesc Biotinbildung ohne externe S-Quelle konnte durch cine Ubertra- 
gung von Schwefel aus dem in BioB nachgewiesenen 2Fe-2S Cluster erkliirt werden. Dielalsachliche Schwefelquelle lur 
die Biotinsynthesc ist nach wic vor unklar. Damit konnte bishcr in vitro kcinc cchtc katalytischc Aktivitat von BioB 
nachgcwicscn werden. 30 

Trot/, dieser Viclzahl von Ansatzen rcicht die Ausheute an Biotin durch mikrobicllc Fermentation bishcr fur eine in- 
duslrielle Produktion nicht aus. 

Aufgabe der vorlicgendcn Erfindung war cs. ein technisches. fermentatives Verfahren zur Herstellung von Biotin zu 
cntwickeln. daB cine moglichst optimalc Umwandlung von Dethiobioiin in Biotin aulweisl und damit cine verbesscrte 
Biotinsyn these crmoglicht. 35 

Diesc Aufgabe wurde durch das erfindungsgemafie Verfahren zur Herstellung von Biotin, dadurch gekennzeichnet, 
daB man ein Biolingen mit der Sequenz SEQ YD No. 1 oder SEQ ID No. 3 sowie seine funktionellen Van an ten, Analoge 
oder Derivate in einem prokaryontischen oder eukaryonlischen Wirtsorganismus, der in der Lage ist Biotin zu syntheli- 
sicrcn, cxprimicrt. dicsen ziichtct und das synthetisicrte Biotin dirckt, nach Abtrcnnung der Biomassc oder nach Rcini- 
gung des Biotins verwendel, gclosi. 40 

Die im erfindungsgemaBen Verfahren verwendeten Biotingcne mil den Sequcnzen SEQ ID No. 1 bzw. SEQ ID No. 3 
werden in der SwissProt-Datenbank unter den ,, Accession' , -Nummern AE000364 und D90811 gefiihrt. Die Sequenz 
D9081 1 wirdauBcrdcm von Aibact al. in DNA Res. 3, 6 ? 1996 : 363-377 beschrieben. Bei beiden Sequenzen wird in der 
Datcnbank eine Homologie zum Nit>*-Protcin vermerkt. 

Weitere Infonnationen zu diesen Sequenzen sind der Datenbank bzw. der Publikation nicht zu enlnehmen. 45 

Durch Expression der Sequenzen SEQ ID No. 1 und/oder SEQ TD No. 3 in einem prokaryontischen oder cukaryonti- 
schen Wirtsorganismus laBt sich die Produkti vital der Biotinbiosynthese deutlich steigern. Durch die Expression der 
Gene wird die Synthese von Biolin aus Dethiobioiin um mindestens den Faktor 2 gegenuber der Kontrolle ohne diese 
Gene, bevorzugl um einen l aktor groBer 3, gesteigerl. Bevorzugl. wird die Sequenz SEQ ID No. 1 verwendel. 

Nach Isolicrung und Sequcnzierung sind die im erfindungsgemaBen Verfahren verwende|en Biotingene mil den Nu- 50 
klcotidscqucnzcn SEQ ID No. 1 und SEQiD No. 3 crhalilichrdic fur die in SEQ ID NO: 2 und SEQ ID No. 4 angegc- 
benen Aminosauresequenzcn odcrdercn Alletvariationcn kodieren. Unter Allelvarianten sind SEQ ID No. 1- oder SEQ 
ID No. 3-Varianten zu verstehen, die 40 bis 100% Homologie auf Aminosaureebene, bevorzugl 50 bis 100%, ganz be- 
sondcrs bevorzugl 80 bis 100% aufweisen. Allelvarianten umfassen insbesondcre funklionellc Variantcn, die durch De- 
letion, Insertion oder Substitution von Nukleotiden aus der in SEQ TD NO: 1 oder SEQ ID NO: 3 daigesiellten Sequenz 55 
erhalilich sind, wobei die enzymatische Aktivitat aber erhalten bleibt. 

Unier Analoge von SEQ ID NO: i oder SEQ ID NO: 3 sind beispielsweise ihrc baktcriellen, pilzlichcn, pflanzlichen 
oder Hefe-Homologen, vcrkiirzte Sequenzen, Einzelstrang-DNA c»der RNA der codierenden und nichtcodierenden 
DNA-Sequenz zu verstehen. 

Derivate sind beispielsweise Promolorvarianlen zu verstehen. Die Promoloren, die den angegebenen Nukleolidsc- 60 

quenzen vorgcschaltcn sind, konncn durch cin oder mchrcrc Nukleotidaustauschc, durch Inscnion(cn) und/odcr Dclci i- 

_on(cnJjvcrandc^ sind. Des wci- 

tercn konncn die Promotorcn durch Vexandcrung ihrcr Sequenz in ihrcr Wirksamkeit erhoht oder komplett durch wirksa- 
merc Promotorcn auch artfremder Organismen ausgctauscht werden. 

Unter Derivaten sind auch Variantcn zu verstehen, dcrcn Nuklcotidsequenz im Bcrcich von -1 bis -30 vor dem Start- 65 
kodon so vcrandcri wurden. daB die Gcnexpression und/oder die Protcinexprcssion erhoht wird. Vorteilhaflcrwcisc ge- 
schicht dies durch eine verandcrte Shinc-Dalgamo-Scqucnz. 

Als prokaryontische Wirtsorganismen des erfindungsgemaBen Vcrfahrcns kommen prinzipicll allc Biotin synthetisie- 
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rcndcn eramnegativen odcr gram- posi liven Baktcrien in Frage. Als gramncgative Baktericn scien bcispielhafi Enteroh- 
acteriaccae wic die Gallungen Rscherichia, Aerobactcr, Enterobacler, Citrobaclcr, Shigella, Klebsiella, Serratia. Erwinia 
odcr Salmonella, Pseudomonadaceae wie die Gallungen Pseudomonas, Xanthomonas, Burkholderia, Gluconobacler, Ni- 
irosomonas. Nitrobacler. Meihanonionas. Comamonas. Cellulomonus odcr Acelobacier, Azoiobacleraceae wie die Gal- 
5 lungen A/olobacler. A/omonas, Beijerinckia oder Derxia, Neisseriaceae wie die Gallungen Moruxella. Acinelobacler, 
Kingclla. Neisseria odcr Branhamclla, die Rhizobiaccac wic die Gattungcn Rhizobiuin odcr Agrobacterium odcr die 
gram-ncgaiivcn Gallungen Zymomonas, Chroniobactcrium odcr Flavobactcrium, genannt. Als grain-positive Bakicricn 
scien beispiclhaii die Endosporen-bildcnden gram- posi liven aeroben oder anaeroben Bakterien wic die Gattungcn Bacil- 
lus, Sporolaciobacillus oder Clostridium, die coryneformen Bakterien wie die Gallungen Arthrobactcr, Ccllulomonas, 

K) Curiobacterium. Coryncbacterium. Brcvibaclcrium, Microbacterium oder Kurthia. die Actinomycetalcs wie die Gallun- 
gen Mycobacterium. Rhodococcus, Strcpiomyccs oder Nocardia, die Laciobacillaceae wic die Gattungcn Lactobacillus 
oder I^actococcus. die gram-posi liven Kokkcn wic die Gallungen Micrococcus odcr Staphylococcus, genannt. 

Bevorzugt wcrden Bakterien der Galtungen Escherichia. Citrobacter, Serratia, Klebsiella, Salmonella, Pseudomonas, 
Comamona's, Acinelobacter, Azotobacter, Chromobacterium, Bacillus, Clostridium, Arthrobactcr, Coryncbacterium, 

15 Brevibacterium, Lactococcus. Lactobacillus, Strepiomyces, Rhizobium, Agrobacterium odcr Staphylococcus im erfin- 
dungsgemaBen Verfahren verwendet. Besonders bevorzugt worden Gattungcn und Art en wie lischerichia coli, Citrobac- 
ter treundii, Serratia marcescens. Salmonella typhimurium. Pseudomonas mendocina, Pseudomonas aeruginosa, Pseu- 
domonas mutabilis, Pseudomonas chlororaphis', Pseudomonas fluoresceins, Comamonas acidovorans, Comamonas tcslo- 
steroni. Acinelobacler calcoaccticus, Azotobacter vinclandii, Chromobacterium violaceum. Bacillus subtilis, Bacillus 

20 sphaericus. Bacillus stearothennophilus. Bacillus pumilus. Bacillus licheniformis. Bacillus amyloliquefaciens. Bacillus 
mcgaierium. Bacillus ccreus. Bacillus thuringiensis, Arthrobactcr citreus, Arthrobactcr parafiineus, Coryncbacterium 
gluTamicum, Corynebacterium primorioxydans, Coryncbacterium sp., Brevibacterium ketoglutamicum, Brevibacterium 
linens, Brevibacterium sp., Strepiomyces lividans, Rhizobium leguminosarum oder Agrobacterium tumefaciens. \brteil- 
hafterweisc werden Bakterien verwendet, die schon cine erhohtc natiirlichc Biotinproduktion besirzen. 

25 Die taxononiische Stellung der aufgefuhrtcn Gattungen unter lag in den letzten Jahren einem starken Wandel und be- 
findet sich noch imrner im FluB, da falschc Gattungs- und Artnamen korrigierl werden. Aufgrund dieser in der Vergan- 
genheit haufig erforderlichen laxonomischen Umgruppierungen der genannten Gallungen innerhalb der bakieriellen Sy-' 
siematik sind auch andere als die oben genannten Familien, Gallungen und Arlen fur das crfindungsgemiiBe Verfahren 
gecignet. 

jo Als cukaryontischc Wirlsorganismcn des erfindungsgemaBen Vcrtahrcns kommcn prinzipicll allc Biotin synthetisic- 
renden Organismen in Frage wie Pilzc, Helen, Pflanzen oder pflanzliche Zellcn. Als Ilefcn scien die Gattungen Rhodo- 
torula. Yarrowia, Sporobolomyccs. Saccharomyces oder Schizosaccharomyccs bevorzugt genannt. Besonders bevorzugt 
sind die Gattungen und Arten Rhodotorula rubra. Rhodotorula glutinis, Rhodotorula graminis, Yarrowia lipolytica, Spo- 
robolomyccs salmonicolor, Sporobolomyccs shibatanus oder Saccharomyces cerevisiae. 

35 Als Wirtsorganismus konncn prinzipicll alle Pflanzen verwendet werden, bevorzugt werden Pflanzen, die in der Tier- 
ernahrung odcr in der humanen Ernahrung cine Rolle spiclen wie Mais, Weizen, Gcrste, Roggen, Kartofteln, Erbsen, 
Bohnen, Sonnenblumen, Palmen. Hirse, Sesam. Kopra oder Raps. Auch Pflanzen wie Arabidopsis lhaliana oder Lavan- 
dula vera sind gecignet. Besonders bevorzugt werden pflanzliche Zellkuliurcn, Protoplaslen aus Pflanzen oder Kaluskul- 
turcn. 

40 Vortcilhaftcrwcise werden im erfindungsgemaBen Verfahren Mikroorganismen wic Bakterien, Pilzc, Hcfcn odcr 
pflanzliche Zellen verwendet, die in der Lage sind Biotin in das A nzuchts medium auszuschciden und die gege ben en falls 
zusatzlich schon cine erhohte naiiirliche Biotinsynthese haben. Voneilhafterweise konnen diesc Organismen noch bcziig- 
lich der Regulation ihrer Biolinbiosynthese defekt sein, das heiBt es findet keine oder nur cine sehr vcrringerte Regula- 
tion der Synthesc siatt. Dieser Rcgulationsdefekt hat zur Folge, daB diesc Organismen schon cine wescntlich hbherc Bio 

45 tinprodukti vital, besit/en. Ein solcher Regulationsdefekt ist beispielsweise von Escherichia coli als birA-Defektmutanten 
bckannt und solltc vorzugsweise in Form eines durch iiuBere Einflusse induzierbaren Detektes, beispielsweise tcmpera- 
lurinduzierbar, in den ZeHen vorhanden sein. Es konnen im Prinzip auch Organismen verwendet werden, die keine na- 
iiirliche Biotinproduklion aufweisen, nachdem sie mil den Biotingenen trans for miert wurden. 

Uin die Biotinprodukliviiat insgesanil weiter zu sleigern solllen die Organismen im erfindungsgemaBen Verfahren 

50 vorteilhaftcrweise zusatzlich mindesien ein wciieres Biolingen ausgewahlt aus der Gruppc bioA, bioB. bioF, bioC. bioD. 
bioll, bioP. bioW. bioX, bioY odcr bioR enthallen. Dieses zusaizlichc Gen odcr diesc zusatzlichcn Gene konncn in cin 
odcr mehrcren Kopicn in der Zclle vorhanden sein. Sic konncn auf dem gleichen Vcklor wic die Scquenzen SEQ ID No. 
1 und/oder SEQ ID No. 3 lokalisiert sein odcr auf getrennten Vckiorcn oder aber chromosomal integriert worden sein. 
Auch die Sequcnzcn SEQ ID No. 1 und/oder SEQ ID No. 3 konncn ins Genom inscricrt werden. 

55 Unter dem erfindungsgemaBen Genkonstrukt sind die Biotingensequenzen SEQ ID No. 1 und SEQ ID No. 3 sowie de- 
ren funklionelle Variantcn. Analoge oder Derivate zu verstehen, die mil einem oder mehrcren Regulationssignalcn zur 
Erhohung der Genexpression funktioncll vcrknupft wurden. Zusatzlich zu dicsen neuen Regulationsscquenzcn kann die 
naiiirliche Regulation dieser Scquenzen vor den eigent lichen Strukturgenen noch vorhanden sein und gegebenen falls ge- 
netisch veranderl worden sein. so daB die naiiirliche Regulation ausgeschallel und die Expression der Gene erhohl wurde. 

60 Das Genkonstrukt kann aber auch einfacher aufgebaut sein, das heiBl es wurden keine zusiilzlichen Regulaiionssignale 
vor die Scquenzen SEQ ID No. 1 und/oder SEQ ID No. 3 inscricrt und der natiirlichc Promolor in^dncrJ<c^btior^ 

__^urde_nicht _cnifcr.nt.-SiatLdc.sscn^ durch Bio- 

tin mehrcrfolgi und die Genexpression gesteigen wird. Auch am 3'-Endc der DNA-Sequenzen konnen zusaty.Iichc vor- 
tcilhafte regulaiorische Elemcnte inscricn werden. Die Biotingcnc mit den Scquenzen SEQ ID No. 1 und/oder SEQ ID 

65 No. 3 konncn in ciner odcr mehrcren Kopicn im Genkonstrukt enthallen sein. 

Vbrieilhafte Regulationsscquenzcn fur das crfindungsgcmaBe Verfahren sind beispielsweise in Promoioren wic cos-, 
tac-. trp-. let-, trp-ict-. Ipp-, lac-, lpp-lac-. laclV T5-, T3-. gal-, trc-. ara-, SP6-. X-PR- ocicr im X-P L -Promotor enl- 
halten, die vorteilhaflerwcisc in gram-negativen Bakterien Anwcndung finden. Weitcrc vorlcilhafie Regulationssequen- 
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zcn sind bcispiclswcisc in den gram-posiliven Promotoren amy und SP02, in den Hefcpromotoren ADC1 , MErx AC P- 
60, CYC1, GAPDH odcr in den Pflanzenpromotoren CaMV/35S, SSU, OCS, Iib4, usp ? STLS1. B33, nos oder im Ubi- 

quitin- oder Phaseolin-Promotor enthalten. 

Prin/ipiell konnen alle nalurlichen Promotoren mil ihren Regula!ionssequen/en wie die obcn genannicn luruas ernn- 
dungsgeinaBe Vcrfahrcn vcrwendet werden. Daruberhinaus konnen auch synlhelischc Promotoren vorteilhall verwendel 

WL Im C (Jcnkonstruki konnen wciicrc Biotingene ausgcwahlt aus dcr Gruppc bioA, bioB, bioK bioC, biolX bioH. bioP, 
bioW bioX bioY oder bioR in einer oder mehrercn Kopien enihalicn sein. die cinen eigcnen Promotor haben konnen 
oder abcr unter dcr Regulation des Promotors der Scquenzen SEQ ID No. 1 odcr SEQ ID No. 3 hegen konnen. 
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YEpG YEpH odcr pEM-BIYe23 oder in Pfianzen pLGV23, pGHlac + , P BIN19, pAK2004 oder pDH51. Die genannten 
Vekioren stollcn cine kleine Auswahl der moglichen Vektoren dar. Weiiere Vektoren sind dem Eachmann wohl bekannt 
und konnen beispielswcise aus dem Buch Cloning Vectors (Eds. Pouwels P. H. el al. Elsevier, Amsierdani-New York- 
Oxford. 1985. ISBN 0 444 904018) cntnommen werden. 

Unter Pxpressionssystcme sind die Koinbinaiion aus den oben heispielhaft genannten Wirtsorganismen und den zu 
den Organismen passenden Vektoren wic Plasmide. Vircn oder Phagen wie das 17 RNA Polynicrase/Promotcr System 20 
odcr Vektoren mit reeulatorischcn Scquenzen Pur den Phagen X zu verstehen. 

Bevorzugl sind unter dem BcgrilT Expressionssysteme die Koinbinaiion aus Escherichia coh und scinen Plasmidcn 
und Phagen und den dazugehorenden Promotoren sowie Bacillus und seine Plasmide und Promotorcn zu verstehen. 

Eur die vortcilhafte crfindungsgemaBe Expression der SEQ ID No. 1 und SEQ ID No. 3 sind auBerdem weitere 3" und/ 
oder 5' Terminate regulatorische Scquenzen geeignet. 

Diese regulatorischen Scquenzen sollen die geziclte Expression der Biotingene und dcr Proteinexpression ermogh- 
chen. Dies kann beispielswcise jc nach Wirlsorganismus bedeuten, daB das Gen erst nach Induklion exprimiert oder 
uberexprimieri wird. oder daB es soforl exprimiert und/oder uberexprimieri wird. 

Die regulatorischen Scquenzen bzw. Eaktorcn konnen dabci vorzugsweisc die Biotingcnexprcssion positiv bccinflus- 
scn und dadurch crhohen. So kann cine Vcrstarkung dcr regulatorischen Elcmcntc vortcilhaftcrwcisc auf dcr Transknp- 30 
tionscbene crfolgcn, indem siarke Transkriptionssignale wic Promotoren und/oder "Enhancer" vcrwendet. werden. Dane- 
ben ist abcr auch cine Versiiirkung der Translation moglich, indem beispielswcise die Stabilitat der mRNA verbesscrt 

wird. , 

Unter "Enhancer" sind beispielswcise DNA-Sequcnzcn zu verstehen. die iibcr eine verbesserte Wechselwirkung zwi- 
schen RNA-Polymerasc und DNA eine erhohte Biotingcnexprcssion bewirken. 35 

Eine Stcigcrung der von den Scquenzen SEQ ID No. 1 oder SEQ ID No. 3 abgeleiietcn Proteinen und ihrer Enzymak- 
livilai laBl sich zum Beispiel gegenuber den Ausgangsenzymen durch Veranderung der enlsprechenden Gensequenzen 
oder der Scquenzen seiner Homologen durch klassische Mulagenese wie UV-Beslrahlung oder Behandlung mil ehemi- 
schen Mutagcnticn und/oder durch geziclte Mulagenese wie site directed mutagenesis, Dclction(cn), Insertion(cn) und/ 
odcr Subslitulion(cn) crzielcn. Auch kann cine crhohtc Enzymaktivitat neben dcr beschricbcncn Gcnamplilikation durch 40 
Ausschaltung von Eaktoren, die die Enzymbiosynthesc rcprimieren und/oder durch Synthese aklivcr stall inaktiver En- 
zyme crrcichi werden. 

Durch das erfindungsgcmaBc Verfahren wird die Umwandlung von DTB in Biotin und damit die Biotinproduktivitat 
insgesamt Liber die in die Organismen Liber Vektoren und/oder chromosomal klonierten Biotingene mit den Scquenzen 
SEQ TD No. 1 oder SEQ ID No. 3 vorteilhaft gesteigert. 4S 

Im erfindungsgemaBen Verfahren werden die SEQ TD No. 1 und/oder SEQ ID No. 3 cnthaltenen Mikroorganismcn in 
einem Medium, das das Wachstum dieser Organismen ermoglicht angezuchtet. Dieses Medium kann ein synthetisches 
oder ein naturliches Medium sein. Je nach Organismus werden dem Eachmann bekannte Medien verwendet. Eur das 
Wachstum der Mikroorganismcn enLhalten die verwendeten Medien eine KohlenstolTquetle, eine Slicksloffquelle. anor- 
ganische Salze und gcgebenenfalls gcringc Mengcn an Vitamine und Spurenelcmente. 50 

Vortcilhafte JKohlcnstotVquellcn sind bcispiclswcisc Zuckcr wic Mono-, Di- odcr Polysaccharide wic Glucose, Eruc- 
tosc7Mannose^ Xylose, Galactose, Ribose, Sorbose, Ribulose. Lactose, Maltose, Saccharose, Rullinosc, Starke oder Cel- 
lulose, komplexe Zuckerquellcn wic Mclasse. Zuckcrphosphate wie Eructosc-K6-bisphosphat, Zuckeralkohole wie 
Mannit, Polyole wie Glycerin, Alkohole wic Methanol oder Elhanol, Carbonsaurcn wic Citroncnsaure. Milchsaure odcr 
Essigsaure, Eette wie Sojaol oder Rapsol, Aminosaurcn wie Glulaminsaure oder Asparaginsaurc oder Aminozucker, die 55 
auch gleichzeitig als Slicksloffquelle vcrwendet werden konnen. 

Vortcilhafte Sticksicffqudlcn sind organische oder anorganische SlickstolTverbindungcn oder Materialicn, die diese 
Verbindungen enlhallen. Beispiele sind Ammoniumsalzc wie NTI4CI oder (NI -LO2SO4, Nitrate, Harnstoff, o<lcr komplexe 
SlicksloiTquellen wie Maisquellwasser, Bierhefeaulolysal, Sojabohnenmehl, Weizenglulen. Hefecx Iraki, Eleischexlrakl, 
Caseinhydrolysat, Hefe oder KarlolTc I protein, die haufig auch gleichzeitig als SlickstolTquelle dienen konnen, 60 

Beispiele fur anorganische Salzc sind die Salze von Calcium, Magnesium, Natrium, Mangan.JCali^ L ZinJ^Kupfcr___ 
und Eiscn. Als Anion dicscr S alzc,sind.bcsondci^.das-Chlor-,-Sulfat--und"Phosphation^zu'ncnncn. Ein wichtigcr l ; aktor 
^uTStcigcrung dcr Produktivilat im criindungsgemaBcn Verfahren istder Zusatz von Ec 2f oder I-e^-Sarzen und/oder Ka- 
liumsalzen zum Produklionsmedium. 

Gcgebenenfalls werden dem Nahrmcdium weitere Wachstumsfaktorcn zugeselzt. wie beispielswcise Vitamine odcr 65 
Wachslumstordercr wie Riboflavin. Thiamin, Eolsaure, Nicotinsaurc, Pantothcnat oder Pyridoxin, Aminosaurcn wie 
Alanin. Cystcin, Asparagin. Asparaginsaurc, Glutamin, Serin, Methonin odcr Lysin, Carbonsaurcn wic Citroncnsaure. 
Ameiscnsaurc, Pimelinsaure oder Milchsaure. odcr Substanzcn wic Dithiothreiiol. 
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Zur S.abilisicrung dcr Vek.oren mil den Biolingencn in den Zellen konnen gegebencnfalls An.ibio.ika den, Medium 

''TSi^gsverhahnis der gcnann.cn Nahrs.olTe hang, von der An dcr fen.en.auon ub und wird in, Ein^llalllfesl- 
JL. i>.. M-iiu-koiuDoncmen konnen alle zu Beginn der Fermcnuiliun voigelegl werden. nuchde... sic la lb. crlordcr- 
^ gc.^^ slcrilisier. wurden. odcr aberje nach Bedarf wahrend der Fcnnen.anon nachgc 

g ti"e Sungsbcdingungcn werden so fcs.gc.cg,. daB die Organis.nen op.i.nal wachscn ^^^S^i 
Au S beu,nerreich.wcrden^ 

len.pera.uren zw^hen 25 C und 37 C isl cinc l nku b a ,ionsdauer von 8 bis 240 Slunden bc- 
CuJ ^X^S^^ ^^^ ™ sich die maxima* Mengc an Bio.in in, Mc- 

'tTeZ^ -'nu^ich Oder ba.cb-weise durch^hnwer 

del WerSen al den mi. den Bio.ingenen ,ransfon>,icr,en Pflanzcnzcllcn ganze Pflanzen regencner,. so konnen d.ese 
nach den, crfindungsgemuBe-n Verfahren ganz normal angeziich.et und vermehr. werden. 
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Beispiele 



Ausechcnd von der Ubcrlegung. daB an der Un.sc.zung von DTB zu Bio.in auBcr BioB und den bekann.cn wci.ercn 
KoVakforen "noglicherwcise cin Fc-S-Clus.cr-regcnericrendes Enzyn, be.cil.gl sen konn.e. wurdc der Versueh un.er- 

^-cSnc^inK^ 

Datenbanken Swiss-Pro. und PIR mi. den. Progranimpake. Laseigene (DNA-S.ar ^^MU^J^ 
konn.e ein s.reng konscrviertcr Bcreich diescr Pro.eine mil der Am.nosauresequenz HK(IJ.,)xGPxG (x cn spneh. Am. 
no^ren n i geringerbzw. nich. crhal.cner Konscrvierung) iden.ifizier. werden. Die Ta.sachc dcr volLs.and.gen Konscr- 
W^ngdll^ScqL/. deu.c, aufeinc wich.ige Rolle diescr AminosUun*, (= As) in der Funkhon d.eser Pro.e.nen h.n. 
Dicsc konscrvicr.cn Aminosaurcn werden in. folgcndcn als Mol.v I bczc.chncl. . . p - 

Das derar. bcschricbcnc As-Mo,iv dicn.e als Vcrglcichscqucnz lUr enc wc.erc Analyse ^ .^'™^ k F J^ 
PIR Release 93 bzw. 94 nach Pro.einen bzw. ORFs (= open reading trame) zu suchen. ,n denen d.ese N.ft-I unk,, ° n ^- 
quenz volls.andig konscrvicn is.. Als Progranm. fur die Scquenzanalyse wurde das Program.,. Gencman des Pake.s 
DNA-Slar cingesetzl. Die Analyseparame.er wurden wie folgl fixicrt: Mcnuc "consensus sequence mil e.ner 80 /<> yio n - 

^sFlrfeSs^ieserRcchcrchc wurde gefunden. daB neben berei.s als NiK-homolge Pro.eine iden.ifiziertc Pro.eine 
wei.cre pro.eine/ bzw. ORFs exis.ieren. die dieses Sequcnz.no.iv aufweiscn. Un.er den ,n der Da.cnbank cn.hal.enen 
wci.ercn Sequenzen konn.e ein o.Tenes Lcscras.er aus E. coli mi. signifikan.er Konservierung der ^"sensus-Sequenz 
.den.ili/ier. werden. das wie die eigenen Arbei.cn zcig.en an der B.ohnsyn.hese belong. >sl. Dieses offene Lcscras.er , in. 
dcr Bc/cichnune ECU29581 24 (= SEQ ID No. 1 = ORF401) kodicrl fur cin hypolhc.ischcs von d.cscr Scqucnz abgc- 
Ici.c.es Pro.cin von 401 As. Es zcig.c sich. daB dicsc Scqucnz in. Rahn.en dcr E. coli Ocnomscqucnz.cn.ng durch 1, 
Blauner und Mi.arbei.ern sequenziert worden war (DNA-Research 1996). ohne daB dessen Funk.ion erkann. worden 
war Dicse Scqucnz (SEQ ID No. 1) wird im Nachlolgenden als BioSl bezeichnel. ^ 
Vcrglcich. man die Pro.einsequenz von BioSl mil der von NifS aus A. vinelandii (Program.,,: DNA-Slar- Megalign 
in, Modus: paarweises Aligncmcn, nach Lipman-Pearson. Analyseparame.er: k-.uple 2. gap-penally 4. gap-lengih-pen- 
ahv 1">) /ci"l sich daB 1 'CU2958 1 _24 audi in andcrcn Bereichen der Scqucnz iibcr e.nen Scquenzbcreich von _ 18 as 
cine Homology von 27.6% zu NifS aus A. vinelandii aufwcisl. Gegeniibcr den. als NifS iden.inzier.cn. Pro.cn aus Rho- 
dococcus capsulars betragl die Homologie 25.3% ubcr eincn Bereich von 376 As. ■.„.,„ pn nOSXI ^4 

In der Dalcnbank Swiss-Prol/PIR konn.cn weitere Sequenzen iden.ifiz.eri werden. die Homolog.en /.u hCU~>581_-4 
aufweiscn (Program,,, Geneman/ Modus sequence sin.ilari.y. Eins.ellungen delaull). Die hochs.e gclundefle Scquenz- 
ahnlichkei. /u FCU29581.24 zeial cin iranslaiicner ORF (= open reading frame) aus H. mfluenza (Da.enbankbe/.e.ch- 
nune HIU00082 62). V-wischcn BioSl und HrU00082j62 wurdc cinc Scquenzhoniolgic von 45.5% ubcr d,c gcsam.c 
Lanle bcider Proicine gefunden. Die Sequenzahnlichkei, bzw. die Homologie beider Pro.eine ,s. dam,, sigmhkani hohcr 
als zwischen ECU29581_24 (= BioSl) und NifS aus R. capsula.us bzw. A. vinelandii. lis handcll s,ch damn vermutlich 

U ^J^^^Z^^9. -995:496-512) war ncben dem ORF HIU00082_62 ein wei.erer ORF 

(TTTUOOO?"' 10)inH influenza aufgrund seiner Scquen/.ahnlichkeil /.u NifS get unden worden. 

Aufgrund diescr Bcschrctbung von FIcischniann ct al. wurde gelolgcd. daB neben bioS 1 auch in \L coli noch ein wei- 
icres NifS-ahnlichcs Gen exisiiert. Dieses hypoihetische Gen wurde bioS2 genannl. 

1 . Konstruklion der Vekloren pHS 1 und pHS2 

l.)i c _piasiiiidc-pRS4-u^ 

sicnzkasscuc. cinen IVomoion eine Klonierungsstcllc. und Ternn^ 

lichen DNA-Fragmcnicn zusaniiiicngcsctzi. Die dafilr noiwcndigen DNA-Vragmcnie wurden durch PCR-Rcakuoncn 
65 mil unterschicdlichcn Plasmidcn ais Matrizcn hergesielii. 
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a) Herstcllung der Kassclic mil eincm Rcplikaiionsursprung 

Uni den Rcplikaiionsursprung aus eincm P15A-Replikon-cnthaltendcn Plasmid als klonicrbarc Kasseiie bereitzustel- 
len wurdc durch cine PCR Reaktion init dem Plasinid pRcp4 (Quiagen) inii den Oligonukleoliden P15A.1 (5- 
GGCCC:CTAGGGG A rA'lXrrCCGClTCCTCGC-3') und P15A.2 (5-GGCCACTAGTAACA ACTTA TA TCGTA- 
TGGGG-3') cin DNA-Fragmeni von 919 Basen Langc aus dem Plasinid isolicrt. Das Fragment wurdc nut den Rcstnku- 
onsenzymen Avrll und Spel in eincm gccignctcn Puffer geschnittcn. 

PCR-Bcdingungcn 

Fs wurden ^IJ Taq-Polvrnerasc sowie 15 pMol der Oligonukleotidc in 100 ul Ansatzlosung zur Isolierung der Rc- 
plikaiionskasscite aus dem Plasinid P Rep4 verwcndel. Die Oligonukleotidc wurden bci 50°C angelagcrt. Die Flongation 
erfolgie bei 72°C fur 1 min. uber 30 Zyklen. 

b) Herstellung der Kanamyzin-Resistenzkassette 

Uni eine Kanainvzin-Resistenzkassctle als klonicrbare Kasseite bereitzustellen wurdc durch cine PCR Ration aus 
eincm die Kanamyzin-RcsistcnzkasseucenthaUcnden Plasinid ( P Rcp4 ^?">^ 

GGCCGAGC rClXJGAACCCCAGAG rCCCGC T-3') und Kan-R,2 (5 -GGCCGAGG 1 CGGAAl IGCCAGCIGG- 
GGCGC-3') cin DNA-Fragmenl von 952 Basen Langc isoliert. Das Fragment wurde mil AalJI und Sad in cinem geeig- 
neicn Puftcr geschnittcn. 

PCR-Bcdingungen 

Fs wurden 2.S U Taq-Pol vmc rase sowie 15 pMol der Oligonukleotidc in 100 ul Ansatzlosung zur Isolierung der Ka- 
namyzin-Resistenzkassette aus dem Plasinid P Rep4 verwcndel. Die Oligonukleotidc wurden bci 50 C angelagcrt. Die 
Elongation erfolgie bci 72°C fur 1 min. uber 30 Zyklcn. 

c) Herstcllung der Terminal ionsbcrcichc 

- Urn den Terminator TO aus dem Phagcn Lambda als klonicrbarc Kasseiie bereitzustellen ^rch eine PCR 
Reason mil dem Plasinid P DS 1 2-luzi (Schroder IT. et al., UMBO Journal^ 11 1 993 4137-4144 als Main ze 
mil den Oligonukleoliden T0,1 (5'-< KKXX) A<5CTCXK:rTC;CiACTCCTC3TrC}AlAG-3 ) . und r0,2 (5^G( (,A( - 
TACrlXJ<r^TCK]A , ^ , (T(:ACX:AATAAAAAA(:(;(XX:-3 , ) ein DNA-Fragment von 120 Basen Langc isohert. Das 
Fragment wurde durch die Enzyme SpcT und Sad in einem geeigneten Puffer geschnitten. 

Matrize fur TO: pDSl 2-luzi 

Fs wurden Taq-Pol ymcrase sowie 15 pMol der Oligonukleotidc in 100 ul Ansatzlosung zur Isolierung des Ttr- 

minationsbcrcichcs aus dem Plasinid pDS12-luzi verwcndel. Die Oligonukleotidc wurden bci 50°C angelagcrt.. Die 
Elongation erfolgie bei 72°C fur 0,5 min. uber 30 Zyklcn. AnschlicBend wurde ein 1 20 bp groBcs Fragment isohert und 
aufgereinigt. Dieses wurde mit je 20 U Spel und Sac I verdaut. 

- Urn den Terminator Tl aus dem rrnB-Operon als klonicrbarc Kassctte bereitzustellen. wurdc durch eine PCRRe- 
akt ion mil dem Plasmid pDS 1 2-luzi (Schroder et al . siehc oben) als Matrize "^J"^ 

(5 -GGCCCCTAC iGTCTA GG G CGGCGG ATTTGTCC-3 ') und Tl,2 <5'-GGCCTC rAGAGGCAF CAAA TAA- 
AACGAAAGGC-3') ein DNA-Fragment von 120 bp Langc isohert. Das Fragment wurdc durch die Enzyme XbaL 
und Avrfl in cinem geeigneten Puffer geschnitten. 

Matrize fur Tl : pDS 1 2-luzi 50 

Fs wurden ^5U Taq- Polymerase sowie 15 pMol der Oligonukleotidc in 100 pi Ansatzlosung zur Isolierung des 'Icr- 
minationsbereiches aus dem Plasmid pDSl 2-luzi verwcndel. Die Oligonukleotidc wurden bei 50°C angelageru Die 
Elongation erfolgie bci 72°C fur 0,5 min. uber 30 Zyklcn. AnschlieBend wurde ein 1 20 bp grofies Fragment isohert und 
aufgereinigt. Dieses wurde mit je 20 U XbaT und AvrTl verdaut. 

d) Herstellung der Promotoren fur pHSl und pHS2 



30 



35 



40 



45 



Die Oligonukleotidc PPHS 1 . 1 (5'-TCGAGATAGCATl^n7\TCCATAA(jAnAOCCO 
TrGTGAGCGCTC ACAA'ITATGATAGA'ITCAATrGTGAGCXJGATAACAArn^CM^ 

und PPHS 1 .2 (5 - CGClAGCGTG IG lGAAAlMVrrArCCGCTCAGAATrGAAlC IAlCA ^ AAI I G 1GAOCGC 1 C 
A i-vn A a *r -'T~rv-MYn-Krcru7W^^^ — PPHS2 T 1 — (-5-AAI-1G-I- 
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ACAAnXiTAAAC lTlA^GAr^ 
CCXJlXlXJAGTGATAGAGATlXjACATCCCTATCAGTGATAGAGAT^ 

CCG-T) und PPHS2.2 (5'-AAITCGG rCAG TGCGTCCrCJGTGATGTCTCAGTATC TC TAI CAC1 GA1 AGGGAI- 
GTCAATC TCTATX ' ACTG ATAGGG AGG-3') wurden durch chctnische Synthesc hcrgcsiclli. Die Oligonukleoiidc 
PPHS1 1 und PPHS1 2 sowie PPHS 2.1 und PPHS 2. 2 wurden jewcils in einer Konzentralion von 1 ug/ul venmscht. 
S min bei 9VC inkubicrt und dann langsam abgekiihll. Die aneinandcrgelagertcn Oligonukleotidc wurden in cmcr Kon- 
'zeniraiion von 10 ng/ul in der Ligation eingcscizi. Die Oligonucleotide PPHS1 .1 und PPHS 1.2 bildelen den Pron.o.or fur 
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das Plasmiri pHSI und die Oligonucleotide PPHS2,1 und PPHS2.2 den fur das Plasmid pHS2. 

e) Hersiellung der Klonierungsstelle 

5 Zur Konslruklion der Klonierungsstelle wurden die beiden Oligonukieoiide PMCS 1,1 (S'-GTACCGGGCCCCCCC- 
TC'GAGGTCXJACGGTATCGAl^AAGCrrGATATCGAATTCCTGCAGCC CGGGGG ATCCC ATGGTA-3') und 
PMCS 1 ~> (S'ACGCG'l'ACCA'lGGGA'rCCCCCGGGClGCAGGAA'riXJGA'rAl'CAAGCl'rA'I'CGA'rACCG 1 CG 
ACCTCGAGGGGGGGCCCGGTACC-3') syntheiisiert. Die beiden Oligonukieoiide wurden in einer Konzentrauon von 
1 ug/ul vcrmischi. 5 nun bei 95°C inkubien und dann langsam abgekuhlt. Die aneinandergelagerten Oligonukieoiide 

10 wurden in einer Konzentrauon von 10 ng/ul in der Ligation eingesetzt. 

0 Klonierungsahlauf von pHSI und pTTS2 

Ausaehend von pDS 1 2 luci wurdc die ampR-Kassclte des Plasmides durch einen Sacl/Aatll- Verdau herausgeschnitten 
15 und durch ein entspreehendes Sacl/Aatll-Fragment ersetzl, das die Kanamyzin-Resitenzkassette cnthalt Nach Translor- 
...alien und Isolierune positivcr Klonc wurdc der erhaltene Vektor Spel/SacI verdaut und der durch ^'™f«™Tn 
Terminator TO als Spel/Sacl-Fragment stroinabwarts der Kana.nyzin-Resistenzk^ 

und Isolicrung positivcr Klonc wurdc der erhaltene Vektor wurdc nut Xbal/Avrll verdau. und der durch PCR-amplifi- 
zierte lemtinL'r Tl als Xbal/AvrU- Fragment eingesetzt. Der erhaltene Vektor wurdc nut 
oo den iewcils aneinandcrgelagerten Promotoroligonukleoiiden (PPHSK1 und PPHSK2 bzw PPHS2.1 und ™>2._) h- 
e ert De enustandene Vektor wurde Xbal verdaut und mil Tlilfe von Klenow-Fragmem autge ullt, dann Kpnl ver au 
und die Vckiorbandc ohne das Luziferase-Fragment isoliert. Zwei weitere aneinandergelagerte Ohgonukleoude 
(PMCS 1,1 PMCS 1 ,2), die die Klonierungsstelle enthalten, wurden mil den so verdaulen Vektoren ligiert. 

25 2. Klonierung von bioS 1 (ECU29581_24, SEQ ID No. 1) 

Das Gen das fur BioS 1 kodieri, wurdc aus den. Chromosom von IT. coli durch eine PCR-Reaklior. arnplifizierl n.il. op- 
limierten Transiationssignalen versehen und in einen Vektor klonierl, der eine Uberexpression des Gens in H coll Slam- 
mcn crmoglicht. 

30 a) lint wicklung von Oligonukleotiden zur Amplifizierung des bioS 1 Gens aus dem IT. coli Chromosom 

BioS 1 soli als ITxpressionskasseitc bcslchcnd aus einer ribosomalen Bindungsstelle. dem Startkodon der kodierenden 
Sequcnz und dem Stopkodon zwischen zwei Erkennungsstellen fur Restriktionsenzyme arnplifizierl werden Fur be.de 
■« Restriktionsschniustelten wurde die Erkcnnungssequenz von MtuI gewahit. Das bioS 1 Gen wurde , mil ™^ d er Wigo- 
" nucleotide PbioShl (5 '-CGC ACGCGTG AGG AGTACC ATG A ACGT- 3 ') und pbioSl,2 (5 -CGCACGCG f I - 
TA ATCC ACC A ATA ATT- 3 ' ) klonierl . 

Durch fuhrung der PGR 
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Bedingungen 



Als Mairizc wurden 0.5 ug chroniosoniale DNA von E. coli W3110 verwendcl. D.e Oligonukieoiide PbioSl J und 
PbioSl 2 wurden in einer Konzcnlralion von je 15 pMol cingeselzt. Die Konzentrauon an dNlPs betrug 200 uM. Als 
Polymerase wurden 2.5 U Pwo DNA-Polymerase (Boehringer Mannheim) im Reaklionspuffer des Herslellers cingc- 
sel/.l. Das Voluiuen der PCR-Rcaklion bclrug 100 ul. 

Ainplifikalionsbedingungen 

Die Dena.urierung der DNA crfolgte fur 2 niin bei 94°C AnschlfcBend wurden die Oligonukieoiide fur 30 sec bei 

55°C anficlaccrt 

Die Ulongaiion erfolgie fur 45 sec bei 72°C Die PCR-Reaktion wurde iiber 30 Zyklen durchgefuhrt. 

Das erhahene DNA-Produkt mil einer GroBe von 1200 bp wurde aufgereinigt und durch Mlul im gceigneten Putter 

ss VC ?ue des Vektors pHSI wurden durch Mlul verdaut und durch Shrimp Alkalische Phosphatase (SAP) (Boehringer 
M ;^h.i,; 0 a— hosnhnrvliicn. Nach Denalurierune der SAP wurden Vektor und Fragment in einem molaren Verhaltms 
von T: 3 'durch dcnRapid-DNA-Ligation Kit nach der Vorschrift des Herslellers ligiert. Die Translonnation des Ligati- 
onsansaizes crfolgte in den Stamm E. coli XL- 1 -blue. . 

Positive Klone wurden durch PI as mid preparation und Restriktionsanalyse idenufizierl. Die nchlige Onenlierung des 
bioSl -Fragments in pHSI wurde durch Reslriklionsverdau und Sequenzierung beslimml. Das-erliaitene KonstrukL 
wurde pHSI bioSl (Kig. 1) genannt. Pic Seq ucnz von pHSI bioSl ist SHQ ID No. 5 zu cninchmcn. 
"Wabgclciicic Aiiiinosaurcscqucnx von 
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Die aDEClCilCic /Aiiiinwsaur^^qutuA. wu ui^j^j * im — - - . ^ - 

bioSl wurden n.il Mlul verdaul unddas Gen bioSl durch ein Agarosegel isolicrl. Der Veklor pHS2 wurde nul Mlul ver- 
daut mil SAP-Phospalhasc dephosphoryllierl und mil dem Fragment bioSl xusammcn in cincr L.galion angcsclzl. Ucr 
Liga.ionsansa./. wurdc in XLl-bluc Iranstonnier. und positive Klonc in der richligcn Onenlierung durch Plasm.disol.c- 
rung und Res.iklionsverdau idenlifi/.iert. Der crhaltenen Vektor wurde pHS2 bioSl (Fi R . 2) genannt. Die Sequen/ von 
pHS2 bioS 1 ist SEQ ID No. 9 zu enlnehmcn. Die abgclcilcle Aminosaurescqucn/. von bioS 1 im Veklor ist Miy UJ no. 



1 0 zu cntnchnien. 
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3. Klonicrung von bioS2 (SEQ ID No. 3) 

U... in E. coli wei.erc Gene zu klonieren. die fiir Gcnproduk.c kodiercn die am Auftau von l-e-S-Clus.ern bc.eilig. 

S," SrZtvejS Sg-tnlTgaJIngn. Modus C.us.a.) von As-Scquenscn von PnHeinen der Da.cnbank Swiss- 
p o.^[R Reiner nohen Hon.o.ogic (> 40%) zun, NifS Pro.cin aus A. vinclandii zcig.c. daB neben den bcrcm beschnc- 
hmcn Scaucn/n.o.iv I auch dor N- Terminus dicscr Protcinc cine s.gmhkanlc Konscrv.crung zeig . 

Als ^^™he N. Ienllinale konscrvienc Sequenz von Pro.einen der NifS-Famihe wurde d.c As-Sequenz „„, der 
SeaucnzMrYLDNXATTidcrHifizicrtundalsMoiivnabczeichnct. 

Fine Analyse der Da.enbank Swissproi/PIR auf eine Konservicrung diescr Sequenz nut nxhr als 80% ze.g.e «n wci- 
.ere Pro^efn in E coli. Von diesem Protein is. durch Edtnan-Abbau crhal.ene N-«cnmnalc Sequenz von 11 As bckunn. 
(DafenbanTbeLich^^ UP06_Hcoli). Dieses Pro.ein wurde als hypo.hcisches Nitt-IIo.no.og angeschen und ,„ Ana- 
loeie ru BioSI als im folecndcn als BioS2 bezeichnet. . 

Un das Uen fiir das Pro.cin BioS2 zu klonieren und zu sequenziercn. wurde fo.gender Wcg beschrmen. Ausgehcnd 
von der Prolcinscquenz HIIJ00072 10 wurde zun. cinen das konserviene An.inosaure-Moi.v I zuni anderen die obui gt- 
n»n S £££ von UP06 Ecoli benu.zu un. degenenerte fiX&XZ 
Fraen.en. des bioS2 Gens zu an.plilizieren. Dalur wurden die be.den As-Mouve HIU00072_10 Monv ) und 
UPOfi Ecoli (Moiiv II b. MKLPIYT DYSAT) in die korrcspondicrenden DNA-Scqucnzcn revecs rans la ucru Aus den. 
Mo S T wurde so das degcncrier.c Oligonuklco.id PbioS2.1 (S'-ATGAARTI^CNAITI 1AYY 1 NOAY- 
^AYWSNGCNAC-3') und aus den. Moliv I das degeneriertc Oligonuklco.id Pb.oS2.2 (5 -cccagh.ggrccr.gca- 
gyltrtgrccrga-3') synthctisicrt. 

Durchfuhrung der PCR-Reaktion 

Als Matrize dicntc chromosoinalc DNA von E. coli W3 1 10. Je 0,5 ug der Oligonukleotide Pbio2 1 und PbioS2,2 wur- 
den niit je 15 pMol Nuklcotidmix, 2,5 U Pwo DNA-Polymcrase (Boehringer Mannheim) im Rcaktionspufter des Htr- 
siellers umgesei/i. Das Volumen der PCR-Reaklion beirug 100 ul. 

Amplitikationsbcdingungcn 

Die Denaiuricrung crfolgte fur 2 min bei 94"C. Die Anlagerung der Oligonukleotide wurde bei 45°C die Elongation 
fur 45 sec bei 7">"C durchgefiihrt. Die PCR wurde uber 30 Zyklcn durchgefuhrt. Durch die PCR konnien drei Fragmentc 
sclekliv amplihzicrt werden, von denen cines die aus den Sequcnzvergleichen crwartetc GroBcvon 600 bp hatie. Dieses 
DNA-Fragment wurde durch Agarosegel-Aufreinigung isoliert und mil dem Oligonuklcoud FbioS2.2 sequenziert. Die 
crhalienc DNA-Sequenz wurde in alien sechs moglichcn Leserastcm translalicri. Die erhaltcnen Iranslalierten As-Se- 
quenzen wurden dann niit der iranslalierten AS-Sequenz von HIU00072_10 bzw. NifS aus A. vinelandii vcrg hchen bi- 
nes der iranslalierten Leserasler zeigt eine hohe Homologie mil der As-Sequenz des besch neben en ORF HIU00072 
und mil bioS2 bezeichnel. 

Uni die gesamtc DNA-Scqucnz von bioS2 (= SEQ ID No. 3) zu bcslimmcn und zu klonieren, wurde tolgcndcr Wcg 

/ue^rwurdc eine markicrten DNA-Sonde hergestelll, die zu bioS2 homolog ist, Dies geschah mil Hilfc des PCR-DIG- 
Labelling-Kit (Boehringer Mannheim). Als Matrize fur die Hcrstcllung der DIG-DNA- Sonde diente das beschnebenc 
PCR-Produkt, das durch die Oligonukleotide PbioS2,l und PbioS2,2 hergestelll wurde. 

Die Bedingungen der PCR waren 

Einsatz- 1 ul der PCR-Matrize. 5 ul Nukleotid-DIG-dUTP-Mix, je 15 pMol Oligonukleotid PbioS2,l und PbioS2,2, 
Puffer des Kits mil 1,75 mM MgCl 2 0,75 ul Expand-Polymerase-Mix (Boehringer Mannheim). 

Amplifikationsbedingungen 

Aufschmcl/en der DNA bei 94°C tur 2 min, Aufschmelzcn der DNA 10 sec bei 94°C, Annealing 30 sec bei 45°C, 
Elongation 3.30 min bei 68°C uber 10 Zyklen. Aufschmelzcn der DNA 10 sec bei 94°C, Annealing 30 sec bei 45 C, 
Elongation 3.30 min bei 68 °C, Vcrlangerung der Elongation fur 20 sec pro Zyklus uber 20 Zykien. Aurreinigung des 
DIG ^markicrten Fragments durch PCR-Purificaiion Kit. 

4. Southern-Analyse von bioS2 niit chromosomaler DNA 

In weiieren Schrilten wurde genomische DNA durch Reslriklionsenzyine verdaut und durch Soulhern-Hybridisierung 
mil Hilfe der markierten DNA-Sonde analysiert. 

Chromosoinalc E. coli DNA W3110 (10 ug) wurde mil. den folgcndcn Rcstriklionsenzymen vollstandig verdaut 
— KcoRrBWiHirA^5rHifKirrrrsarDaTVblmirc 

wurden 4 h inkubiert. Die derart vcrdaule DNA wurden durch ein 1% Agaroscgcl in -'FBB-Puffcr (Sambrook. J.Fnlsch, E 
F Maniatis, T. 2nd ed. Cold Spring Harbor Laboratory Press., 1989, ISBN 0-87969-373-8) aufgetrcnnt und mil Hilfc ci- 
ncr Druckubertragungskamnicr (Stratagcne) auf eine Nylon-Mcmbran (Bochrincger Mannheim) ubcriragcn und durch 65 
UV-Bcsirahlung (Stratalinkcr, Slratagene) kovalcnt an der Membran fixicrt. Die Hybridisierung erfolgte nut der DK,- 
markicnen DNA-Sonde in DIG-Easyhyb Puffer (Boehringer Mannheim) bei 65°C Tur 15 h. Die bntwicklung des Blots 
nach Anweisungcn des Herstcller zcigl Hybridisierung der BioS2-DIG-DNA-Sonde mil Banden, die nut GroBen von ca. 
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3-4 kh im Fall von Acc65I KcoRI und Hinrtll hertin.n.1 wurden. BamHI verdau.e DNA zcig.c eine Hybridisicmng mi. 
tobi^ionde "nfc^m Frogn.cn. cincs wcsen.lich hoheren Mo.eku.argcwich.s. Zur wo.crcn K.omcrung wurden 

Fraginente von 3-4 kb bevor/.ugt welter bearbeiteu 

Klonierung von bioS2 durch inverse PCR 

Im Fall des EdoRI- Verdaus wurdc cin Fragn.cn. von ca. 4 kb idcmirizicr.. das das gcaichic Gen .rag.. Das gesamte 
fwurd^ 

chromosoma l« : Kcol, DNA f"^^ J ^ 0 ;^;| us dcnl vorher bcschrie be n en Rcs.rik.ionsverdau durch I igasc ko- 
SS^S -^cLLh gesehen eine imra.no.cku.are Verknupfung erfo.g, Irn dra.cn 
sS. S dann ei„e PCR-Rcak.ion durchgefuhrt. bci der Oligonukleo.ide e.ngcse.,. werden. dercn Sequen, spe«- 

^t^^^^c^A^u^c konncn anhand ihrer GroBe iden.ifizier. werden. die sich aus der GroBe des 

des Gens ergibf. Derail idcn.ifizicrle Fragn.en.e werden dann m e.nen gee.gne.en Vek.or wu. pBS SK Blucskr.pt/ pLK. 
Scrip. (Sira.agenc) klonierl und sequenzierl. 

Expcrimen.clle Durchruhrung 

1 u C chron.oso.nale DNA aus den. S.an.m W3110 wurde durch 15 U EcoRI (Boehringcr Mannheim) in cinern Vblu- 
men von 50 uUolls.andig verdaut. Die Volls.andigkei. des Verdaus wurde durch Aul.rag von 30 ul auf e.n Agaroscgel 
aZiZ FragmcSieses Verdaus chron.oso.naler DNA (10 ul des Verdaus = 200 ng) wurden m e, nen. Vo.umen yon 
K^s ,„men mil 10 ul T.iga.ionspuffcr und 2 U T4-Ligasc (Boehringcr Mannhe.n.) fur 15 h be. ,5«C ln kub,er, (m- 
iramolekularc Lisalionsrcak.ion). Nach der Ligalionsreak.ion wurde die M-L.gase durch Inkubal.on bu 05 C rur 

5 "SSI diesen. Liga.ionsansa.ziurden 5 ul als Ma.rize fDr eine ^f^^^S^t 
PbioS^3 (5-GCGTGGGTAAACTGCCTATCGACCTGAGCC-3-) und Pb,oS2.4 (5 -C IACGC I TCC I 1 

C 'AlK'CTG(VAGCCGAAA-3) wurden ausgehend von der Sequen/. von bioS2 synlhelisieri. 

aigonuklco.id PbioS2.3 hybridisicrt auf der S'-Sci.c von bioS2 und bewirk. das die Hlonga.ion der Ampl.hkal.on der 
kodicrendcnScquenzaurdcrS'-ScilcaurdeniGcgcnslranginS'-Richlungsiallhndc. 

On^klco.kl PbioS2.4 hvbridisicrl auf der 3'-Sei.e von bioS2 und bewirk. das die Elongation der Ampl.fikal.on der 
kodierenden Scqucnz auf dcr3'-Sei.c auf den. kodierenden Strang in 3'-Richtung s.at.finde.. ~, 

Finsa.r 5 ul des Ligationsansa.z. 1 .75 M l Desoxynuklcolid-Mischung (350 umol, Boehnnger Mannhe.m) jc 1 5 pMol 
Oligonuklcoud PbioS2.5 und PbioS2.6. Puffer 1 des Ki. S mi. 1.75 nuM MgCl 2 0.75 ul Expand-Polymcrase-M.x. 

Sgungen fur die Amplifika.ion der ligierten F, coli DNA mi. Primer PbioS2 LVPbioS^ Hxpand-K.. (Boehnnger 
Mannheim) Aufschmelzen der DNA 2 n.in bei 94°C. Aufschmelzen der DNA 10 sec be, 94X. Annea hng 30 sec be 
6TC Elonga.ion 3.30 n.in bei 68°C uber 10 Zyklen. Aufschmelzen der DNA 10 sec be. 94°C. Anneahng 30 sec be. 

6 rt* Elonga.ion 3.30 ...in bei 68°C. Verlangerung der Elonga.ion Tur 20 sec pro Zyklus uber 20 Zyklen. .- 

Durch die bcschricbcnc Amplilika.ion wurde cin PCR-Produk. von ca. 3 kb crhal.cn. D.cscs DNA-Frag.ner.. ze.g.c >n 
cincr Sou.hcrn-Hybridisicrung untcr slringcn.cn Bcdingungcn cine dcullichc Hybridisicrung m.l der bcrcits bcschncbc- 

"^wufde^anee^ dieses DNA-Fragmcn. DNA-Scqucnzen cnihali, die zu bioS2 hochgradig homolog sind. 

Dahcr wurdc dk-scs DNA-Fragment in eincn Veklor klonierl. urn es wcilcr zu charaklcrisicren und zu scquenz.eren. Das 
DNA-Fragmen. wurdc mi. den, pGR-Skrip. KiL(Siratagene) zuers. laut Anweisung des Hers.cllcrs n.H Ptu-Polymcrase 
behandel. und dann in den Vek.or pGR Skripl ligiert. Der Ligationsansa.z wurde in xL- 1-blue /ellen (S.ralagene) Irans- 
formicr. und auf T.B-Amp ausplatliert. Fin positivcr Klon. der ein Fragmenl. .rug, wurde durch M.mpraparal.onsanalysc 
idcn.in/.icr.. Die Sequenzierung ergab die in S1ZQ ID No. 3 wiedergegebene Gesam.sequenz (= b.oS ). 

BioS2 wurde dann als Expressionskasse.le analog zu bioSl an.pl.nz.er. und klon.ed I D^^*'^"^"' ™ 
PGR ...i. den Oligonukleo.iden PbioS2.5 (5"-C ATG ACGCGTAA AG AGO AG A A ATTAAC ATG A A Al - 
TAGCGA'rrrATTTGG-3 ) und PbioS2.6 (5'-GGGACGGGTGATrAATGATGAGCGC'AT-3 ) e.ne Erkennungsstelle lur 
Mlul und cine op.i.nienc Shinc-Dalgarno Sequenz rauf der 5'Scitc und cine Erkcnnungss.cllc fur Mlul aut-dcr 3 Scuc zu- 
gcfugl. 

Durchfuhrung der PCR 

Als Malrize wurden 0.5 ug chromosomalc DNA von W31 10 eingeselzl. _ _ ^ 

Die Oligonukleolide PbioS2.5 und Pb\oS2.6 wurden in eincr Konzentra.ion von je ia p.vio. e.ngese.zi. w.e ^onzen- 
.ra.ion an dN-lP's be. rug 200 uM. Als Polymerase wurden 2,5 U Pwo DNA-Polymerasc (Boehnnger Mannhe.m) m. Re- 
aklionspuffer des Hers.ellers eingeselzl. Das Volumen cler PGR-Reakuon betrug 100 ul. 

Amplihkalionsbcdingungcn 
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Denaiuricrung 2 sec bci 94 U C. Anlagern der Oligonukleo.ide fiir 30 sec bei 55°C. Elonga.ion fur 45 sec bci 72»G. Die 

P m:i C .^S5S^ Gr.Be von ca. .200 bp wurdc durch den PGR-Purifica.ion-Ki. (Boehringcr 

M X^^^^^M^Z: rnTd7rch d Shrin.p A.kalische Phospha.ase (SAP) (Boehringcr 
Mannheim) dcphosphoryllicrl. Nach Denaturierung der SAP wurden Vek.or und Fragn.en. .n e.nen. molaren Vcrhal.n.s 
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von 1 - 3 durch den Rapid-DNA-T ligation Kil nach dcr Vorschrift des Hcrslellcrs ligiert. Die Transformation des Ligali- 
onsansat/es crfoletc in den S.an.n. XL- 1 -blue. Positive Klone wurden durch Plasmidpriiparation und Resinkuonsanaly.se 
iden.ifiziert. Die rieh.ige Orien.ierung des bioS2-Frag...en.s in P HS2 wurde durch Resmklionsverdau unci Scquenae- 
rum. bcslimml. Der Vek.or wurde iniL P IiS2 bioS2 (Fig. 3) bezeichnel. Die Scqucny. von pHS2 buxS2 is! SEQ ID No. 11 
ym Jn.nehmen. Die abgelei.ele Anrinosauresequenz von bioS2 in. Vek.or is. SEQ ID No. 1 2 zu ^^^^ 
die Klonicrune von bioS2 in den Vcklor pHS 1 vorgenommcn. Die Scqucnz von pHS 1 b.oS2 is. SEQ ID No. 7 zu cn.nch- 
mcn (Fig. 4). Die abgelei.ele An.inosaurcscqucnz von bioS2 im Vcklor ist SEQ ID No. 8 zu cntnchincn. 

5. Konsirukiion des Plasmids pHBbiol4 

Die in vivo-Klonierung des Bio-Operons wurde durch cincn transduzierenden Lambda-Phagcn durchgcfUhrt. Die Sc- 
lek.ion von Ti bio* Phagen erfolg.e durch die Transduk.ion eines E. coli bionega.ivcn S.ammcs zu ^f ^.^ 
ene bio'ransduzierende 1 Jnbda Phlgc wurde propagicn und dieUmbda DNA .ulgennmg. Es folg-c d.c E c, on 
eines 8 7 kb EcoRI/HinDiri-Fragmcn.s mil dem gesanilen Biolin-Operon aus der Lambda-Phagcn DNA und L.ga .on 
d™F™gn.«,.s in pBR322. der EcoRI/IIinDin geschnitien worden war. Positive Klone wurden durch P.asm.dpraparanon 
und Restriktionsanalysc identifiziert. 

Deletion cincs 1,2 Kb Fragments 3' von bioD 

Nicht bcno.ig.e Gensequenzen auf der 3'-Sei.c des bioD Gens wurden entfernt. l y U VTit,e^^ 
.erden. S.opkodon von bioD eine EcoW-Schniiustellc eingebaut. Die ^tw.ck "ng ^ 

TAAc;GAArr(nTATC]TA<nTT(xx;c;rr<;(xx;-3') und Pb» ,2 ( 5 -^«^ lW -^^^^ 

dicse PCR-Reak.ion erfolg.e nach der Operon-Sequenz von Otsuka c, al. (J. B.ol. Chen.. 263, 1988 . 1 9577-85). 

PCR-Bedingungen 

-> 5 U Tuq-Polymerase (Perkin Elmer) und je 15 p.nol Primer wurden in eine... Volume., von 100 ul un.gese.z. Das 
AnneahU wurde bei 50°C und die Elongation fur 1 ...in bei 72"C liber 30 Zyklen durchgetuhr. Isoherung und Aulre.- 
Jigung eine7488 bp-Fragments erfolg.e Uber Agarose-Gel. Verdau des erhaltcnen Fragments ..... IxoRI/Ps.1. Vcrdau von 
nHBbiol mil EcoRI/PsiI. Isolicrung cincs 9.5 kb Fragments. . 
P Das 9.5 kb Fragments wurde mi. dem 488 bp Fragments legier. und in xLl-btue-Zellen trans onmer,. Enhal.er.e K one 
wurden durch Plas.nidprapara.ion und durch Res.riklionsanaly.se der Plasm.d-DNA m, den l.nzy.nen IxoR undTTm- 
DILI analvsiert. positive Klone. die ein 5,9 kb Fragment .rugen. wurden .dent.nz.ert. Es wurde e,n Klon. der nnt pHBbio- 
bczeichnc. wurde. isolierl. Von diescn. Klon wurde Plasmid-DNA gewonnen. 5 ug P HBb.o2 wurden mil EcoRI/II.nDm 
verdaul und das 5.9 kb Fragment isolicrt. das die gesanilen Biolin-Biosynlhesegene enlh.cll 

Tim des Plasmids P AT153 wurden mil EeoRl und HinDIU verdaul. Das erhaltcnen 5,9 kb Fragment ..... den B.ot.n- 
B.osyn.hesegenen wurde ...it dem verdau.en Vek.or pAT153 ligier. und in XL-l-blue .ransfonn.er.. Erhal.ene Klone 
wurden durch Plas.nidprapara.ion und durch Res.rik.ionsanalyse der Plasmid-DNA mi. den Enzymen EeoRI und H.n- 
DIO analysicrt. Positive Klone wurden idenlifizicrl und cin Klon mil dcr Bezc.chnung pllbiol4 isolierl. 

6. Erhbhung der Biotin-Produktivitat durch Uberexpression von bioS 1 

. Slam... BM4092 (Barker und Campbell) wurde durch cine Pl-Transduktion ...it Ililfe eines PI -Lysa.s. das auf eincm 
recA::Tn.0 .ragendem S.amm gewachsen war. nach recA" transducer.. Der Erfolg der rrar.sdukt.on wurde durch e.ne 
erhdh.e UV-Sensilivi.a..der posi.iven Transduk.anden nachgewiesen. Daraufh.n wurde der erhal.ene Slan.m T.U8091n«t 
■ den. Plasn.id P HBhiol4 nach dcr CaCl 2 -Me.hode trans forn.ieri und auf LB-Ampiz.lhn 100 ug/ml ange/ogen. E.n Klon 
wurde isolicr. und diescr wurde jeweils mi. den Plasn.iden pHSl bioSl und pHS2 b,oS2 durch d.c CaCb-Me.hode 
.ranslbm.iertundaufLB-Agar.Ampizillin 100 ug/ml und Kana.Lyz.in 25 ug/n.l selekuon.er,. 

Je eine Kolonie der jewciligcn Transfom.anden wurde in einer DYT-Kullur nul dem en.sprecher.dem Anub.oUka an- 
gcimpf. und fur 12 h inkubien. Die Ubemachtku.tur (= UNK) wurde e.ngese.z. u„. erne 10 ml Kullur h, 1 B-M£ urn 
fsambrook J Fri.sch EF Manialis. T. 2nd cd. C'old Spring Harbor Laboratory Press., 1989 ISBN 0-87969-373-8) mil 
den fm^rechenden Annbiotika anzuin.pfen und uber 24h S.unden angczogen. Nach Ende des Wachs.ums wurden d.e 
Zellcn von, Kul.urubers.and durch Zcn.rifuga.ion abge.renn. und die Biotin- und l>.hiob.o..n-Konzcnirat,on durch e.- 
nen ELISA mi. Slrep.avidin und Avidin im Ubersland besli.nn.t. Die Ergebn.sse d.eser Besl.m.nung s.nd Tabellc I zu 
entnehiuen. 

Tabelle I 
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Beslinunung der Biotin- und Delhiobiolinkonzenlration 



— Stamm— 


-P 1 a s m i d- -I— 


_Blasmid_II__ 


Biotin mg/1 


Dethiobiotin mg/1 


Lu8091 
Lu8091 
LU8091 


pHBbiol4 
pHBbiol4 
pHBbiol4 


pHSl bioSl 
pHS2 bioSl 


15,3 
19,2 


4 5,6 
19, 7 
15, 8 
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SHQUT'N/PROTOKOI J, 

(1) ALGEMEINE INFORMATION: 

(i) ANMELDER: 

(A) NAME: BASF Aktiengesellschaf t 

(B) STRASSE : Carl Bosch Strasse 
( c ) ORT : Ludw i g sh af en 

(D) BUNDESLAND: Rheinland-Pf alz 

(E) LAND: Germany 

(F) POSTLEITZAHL: D-57056 

(ii) ANMELDETITEL: Verfahren zur Herstellung von Biotin 
(iii) ANZAHL DER SEQUENZEN: 12 

(iv> COMPUTER- LE SB ARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBS SYSTEM: PC-DOS/MS-DOS 

< D > SOFTWARE : Patentln Release #1.0, Version #1.25 (EPA) 
(2) INFORMATION ZU SEQ ID NO: 1: 

<i> SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1217 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 



(vi> URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Escherichia coli 
4S (B) STAMM: W3110 

(ix) MERXMALE: 

(A) NAME/SCHLUSSEL: 5 ' UTR 
50 (B> LAGS: 1. -11 

(ix) MERXMALE : 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 12.. 1217 



55 



60 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

CGAGGAGTAC C ATG AAC GTT TTT AAT CCC GCG CAG TTT CGC GCC CAG TTT 
CGAGGAGTAC ATG ^ ^ ^ ^ ^ ^ ^ ^ ^ Qln phe 



50 



1 



5 10 



65 
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CCC GCA CTA CAG GAT GCG GGC GTC TAT CTC GAC AGC GCC GCG ACC GCG 
Pro Ala 12 Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala 

20 

30 ib 

rar rpmm nCC GAA GCC CAA CGC CTG 
SGC CCC » »C CTC «T CCC ACC « «T CCC ^ ^ ^ ^ ^ 

Ser Ala Gly Asn val his Arg .,. 60 

50 55 

,CC rCG OCT TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT 
ACC GCG CGT TA1 ftla Gln hQn Leu Asn 

Thr Ala Arg Tyr Glu Ala Ala Arg i^u uy ^ 

S S = Z Z S S " S S S S S £ S = 

80 85 

s ^ s s s s: s s s £ s s = £ sz s 

95 100 105 

« S S S S = S 2 2 Si 2 2 ^ 2 2 5 

115 Jl^u 

~< 2 s s s - - s s s s s 2 £ 2 s 
2 2 2 s 2 2 2 2 2 2 2 2 2 2 « 

145 150 
ir* CCC CGT ACT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT 
Pro Z stl Arg Xle Leu Ala ,eu Gly Gin Met Ser Asn Va, Thr 

GGC CGT Z CCG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC 

Gly Gly Cys Pro Asp Leu wa Arg ■ - oc - 

180 18b 

GGG ATG GTG GTG ATG GTT GAT GGT GCT CAG GGG GCA GTG CAT TTC CCC 
Gly Met val Val Met Val Asp Gly Ala Gin Gly Ala Val Hxs Pro 
190 195 200 

GCG GAT GTT CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC 
S "p val Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly H« 

11 A 21 t? 



98 



146 



20 

290 



338 



386 m 



434 



530 

45 



578 

50 



626 

55 

674 

60 
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10 



15 



20 



40 



45 



55 



60 



AAA CTG TAT GGC CCG ACA GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA 
Lys Leu Tyr Gly Pro Thr Gly lie Giy Val Leu Tyr Gly Lys Ser Glu 
225 230 235 



AAG ACT GAT GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA 
Lys Ser Asp. val Asp Ala Leu Val .Asn Ala Val Asp. Ar.g_Ala Leu.Glu 
385 390 395 

TTA TTG GTG GAT TA 
Leu Leu val Asp 
400 

(2) INFORMATION ZU SEQ ID NO: 2: 

<i) SEQUENZ CHARAKTERISTIKA: 
(A)— LANGE-:— 40-1— Ami-nosauren — 



722 



770 



818 



866 



914 



CTG CTG GAG GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC 
Leu Leu Glu Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His 
240 245 . 250 

GAA GTG ACT TTT GAC GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG 
Glu Val Ser Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu 

255 260 265 

GAA GCT GGA ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG 
Glu Ala Gly Thr Pro Asn Val Ala Gly Val lie Gly Leu Ser Ala Ala 
270 275 280 285 

CTG GAA TGG CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC 
Leu Glu Trp Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser 
290 295 300 

25 CGT AGC TTA GCA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC 962 
Arg ser Leu Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly 
305 310 315 

30 ppt CGT TCA TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT 1010 
Phe Arg Ser Phe Arg Cvs Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe 
320 325 330 

35 GCT GGC GTT CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT 
Ala Gly val His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly 

335 340 345 

ATT GCC CTG CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA 
lie Ala Leu Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu 
350 355 360 365 

TTA GGC GTA ACC GGC ACA CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA 
Leu Gly Val Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr 
370 375 380 



1058 



1106 



1154 



1202 



1217 
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(B) ART: Aroinosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 
Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 

1 5 10 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 

20 25 
Glu Ala val Val Qlu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 

35 40 " 

Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 

50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 

S5 70 " 

AS p Lys - Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 

85 90 
Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 



He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 



115 



120 



val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 



130 



135 



140 



Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 



150 



145 

Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 



155 



165 



Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 

180 185 
val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 



195 



200 



205 



Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 

215 220 



210 

Gly Pro Thr GlyJ^G^*^^ 



225 "230 



Ala Met ser Pro Trp Leu Gly Gly Gly Lys Met val His Glu Val Ser 



245 



250 
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Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 



Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 

315 320 

305 310 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 33 ° 335 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 3 65 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 3 75 380 

1 Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 



Val Asp 
385 

Asp 



390 395 400 



(2) INFORMATION ZU SEQ ID NO: 3: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1233 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 
<D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

{iii) HYBOTHETISCH: NEIN 

(iii) ANT I SENSE : NEIN 

(vi) URSPRUNLICHE HERKUNFT: 

(A) QRGANISMUS: Escherichia col i 

(B) STAMM: W3110 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: C DS 

(B) LAGE : 19.. 1233 
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160 



165 170 



GCT CGT GGC ATT ATC TAT CAC GTT GAT GCA ACC CAG AGC GTG GGT AAA 
Ala Arg Gly He He Tyr H is Val As p Ala Thr Gin Ser va l Gly Lys 
175 T80 185 



51 

10 

99 

15 

147 

20 

195 



(ix) MERKMALE : 

(A) NAME/SCHLOSSEL: 5'OTR 

(B) LAGE: 1 . . 18 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 

AAAGAGGAGA AATTAACT ATG AAA TTA CCG ATT TAT CTC GAG TAC TCC GCA 

Met Lys Leu Pro He Tyr Leu Asp Tyr Ser Ala 
1 5 10 

ACC ACG CCG GTG GAC CCG CGT GTT GCC GAG AAA ATG ATG CAG TTT ATG 
Thr Thr Pro val Asp Pro Arg Val Ala Glu Lys Met Met Gin Phe Met 
15 20 25 

ACG ATG GAC GGA ACC TTT GGT AAC CCG GCC TCC CGT TCT CAC CGT TTC 
Thr Met Asp Gly Thr Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe 
30 35 40 

GGC TGG CAG GCT GAA GAA GCG GTA GAT ATC GCC CGT AAT CAG ATT GCC 
Gly Trp Gin Ala Glu Glu Ala Val Asp He Ala Arg Asn Gin He Ala 

45 50 55 

GAT CTG GTC GGC GCT GAT CCG CGT GAA ATC GTC TTT ACC TCT GGT GCA 
Ast, Leu Val Gly Ala Asp Pro Arg Glu He Val Phe Thr Ser Gly Ala 
60 65 70 75 

ACC GAA TCT GAC AAC CTG GCG ATC AAA GGT GCA GCC AAC TTT TAT CAG 
Thr Glu Ser Asp Asn Leu Ala He Lys Gly Ala Ala Asn Phe Tyr C-ln 

80 85 90 3J 

AAA AAA GGC AAG CAC ATC ATC ACC AGC AAA ACC GAA CAC AAA GCG GTA 
Lys Lys Gly Lys His He He Thr Ser Lys Thr Glu His Lys Ala Val 
95 100 105 

CTG GAT ACC TGC CGT CAG CTG GAG CGC GAA GGT TTT GAA GTC ACC TAC 
Leu Asp Thr Cys Arg Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr 

110 US 120 

CTG GCA CCG CAG CGT AAC GGC ATT ATC GAC CTG AAA GAA CTT GAA GCA 
Leu Ala Pro Gin Arg Asn Gly He lie Asp Leu Lys Glu Leu Glu Ala 
125 130 135 

GCG ATG CGT GAC GAC ACC ATC CTC GTG TCC ATC ATG- CAC GTA AAT AAC 
A^a Met Arg Asp Asp Thr He Leu Val Ser He Met His Val Asn Asn 
xlo 145 150 155 

GAA ATC GGC GTG GTG CAG GAT ATC GCG GCT ATC GGC GAA ATG TGC CGT 
Ly val val Gin Asp He Ala Ala He Gly Glu Met Cys Arg 



243 

30 

291 



339 



40 

387 



45 

435 



483 



50 



531 55 



579 co 



65 
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15 



CTG CCT ATC GAC CTG AGC CAG TTG AAA GTT GAC CTG ATG TCT TTC TCC 627 
Leu Pro He Asp Leu Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser 
190 195 200 

GGT CAC AAA ATC TAT GGC CCG AAA GGT ATC GGT GCG CTG TAT GTA CGT 675 
Gly His Lys He Tyr Gly Pro Lys Gly He Gly Ala Leu Tyr Val Arg 
205 210 215 

CGT AAA CCG CGC GTA CGC ATC GAA GCG CAA ATG CAC GGC GGC GGT CAC 723 
Arg Lys Pro Arg Val Arg He Glu Ala Gin Met His Gly Gly Gly His 
220 225 230 235 

GAG CGC GGT ATG CGT TCC GGC ACT CTG CCT GTT CAC CAG ATC GTC GGA 771 
Glu Arg Gly Met Arg Ser Gly Thr Leu Pro Val His Gin He Val Gly 
240 245 250 

ATG GGC GAG GCC TAT CGC ATC GCA AAA GAA GAG ATG GCG ACC GAG ATG 819 
Met Gly Glu Ala Tyr Arg He Ala Lys Glu Glu Met Ala Thr Glu Met 
255 260 265 

GAA CGT CTG CGC GGC CTG CGT AAC CGT CTG TGG AAC GGC ATC AAA GAT 867 
Glu Arg Leu Arg Gly Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp 
270 275 280 

ATC GAA GAA GTT TAC CTG AAC GGT GAC CTG GAA CAC GGT GCG CCG AAC 915 
He Glu Glu Val Tyr Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn 
285 290 295 

l5 ATT CTC AAC GTC AGC TTC AAC TAC GTT GAA GGT GAG TCG CTG ATT ATG 9 63 

He Leu Asn Val Ser Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met 
300 305 310 315 

GCG CTG AAA GAC CTC GCA GTT TCT TCA GGT TCC GCC TGT ACG TCA GCA 1011 
40 Ala Leu Lys Asp Leu Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala 

320 325 330 

AGC CTC GAA CCG TCC TAC GTG CTG CGC GCG CTG GGG CTG AAC GAC GAG 10 59 

45 Ser Leu Glu Pro Ser Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu 
335 340 345 



25 



50 



55 



CTG GCA CAT AGC TCT ATC CGT TTC TCT TTA GGT CGT TTT ACT ACT GAA 1107 
Leu Ala His Ser Ser He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu 

350- 355 360 

GAA GAG ATC GAC TAC ACC ATC GAG TTA GTT CGT AAA TCC ATC GGT CGT 1155 
Glu Glu He Asp Tyr Thr He Glu Leu Val Arg Lys Ser He Gly Arg 
365 370 375 



CTG CGT GAC CTT TCT CCG CTG TGG GAA ATG TAC AAG CAG GGC GTG GAT 1203 
Leu Arg Asp Leu Ser Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp 
60 380 385 390 395 



65 
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CTG AAC AGC ATC GAA TGG GCT CAT CAT TA 
Leu Asn Ser He Glu Trp Ala His His 

400 405 

(2) INFORMATION ZU SEQ ID NO : 4: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 404 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKUXS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

Met Lys Leu Pro He Tyr Leu Asp Tyr Ser Ala Thr Thr Pro val Asp 
1 5 10 15 

Pro Arg val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 
20 25 30 

Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 
35 40 45 

Glu Ala Val Asp He Ala Arg Asn Gin He Ala Asp Leu Val Gly Ala 
50 55 60 

Asp Pro Arg Glu He Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
65 70 75 80 

Leu Ala He Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 
85 90 95 

He He Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 HO 

Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 

Asn Gly He He Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 

Thr He Leu Val Ser He Met His Val Asn Asn Glu lie Gly Val Val_ 
145 " 150 " " "155 160 

Gin Asp He Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly He He 
165 170 175 

Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro He Asp Leu 
180 185 190 

Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys He Tyr 
195 200 -205. 
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Gly Pro Lys Gly He Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val 
210 215 220 

5 Arg He Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 

Ser Gly Thr Leu Pro Val His Gin He Val Gly Met Gly Glu Ala Tyr 
10 245 250 255 

Arg He Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly 
260 265 270 

15 

Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp He Glu Glu Val Tyr 
275 280 285 

20 Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn He Leu Asn Val Ser 
290 295 300 

Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met Ala Leu Lys Asp Leu 
25 3Q5 310 315 320 

Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser 
325 330 335 

30 

Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser 
340 345 350 

35 He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu He Asp Tyr 
355 360 365 

Thr He Glu Leu Val Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser 
370 375 380 



40 



Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser He Glu 
385 390 395 400 

45 Trp Ala His His 



(2) INFORMATION ZU SEQ ID NO: 5: 

(D SEQUENZ^ CHARAKTE R I ST IKA : 

(A) LANGE: 3794 Basenpaare 
(3) ART: Nukleinsaure 

(C) STRANG FORM: Einzel 

(D) TOPOLOGIE: ringf ormig 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(iii) HYPOTHET ISCH: NEIN 

(iii) ANTX SENSE : NEIN 
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(vii) UNMITTELBARE HERKUNFT: 
(B) CLON: pHSlbioSl 

(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 601.. 1806 



10 

60 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 
GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG 

AGAATGTCAA GAG GCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC 120 

GGAGCTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA 180 

AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA 240 

^0 

AGCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG 300 

AACAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA 360 

ATGTCCTGAG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT 420 25 

AGCCGATCCT AAG GTTTAC A ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC 480 

GGATAACAAT TTCACACACG CTAGCGGTAC CGGGCCCCCC CTCGAGGTCG ACGGTATCGA 540 

TAAGCTTGAT ATCGAATTCC TGCAGCCCGG GGGATCCCAT GGTACGCGTC GAGGAGTACC 600 

ATG AAC GTT TTT AAT CCC GCG CAG TTT CGC GCC CAG TTT CCC GCA CTA 648 
Met Asn val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
15 10 15 

CAG GAT GCG GGC GTC TAT CTC GAC AGC GCC GCG ACC GCG CTT AAA CCT 596 
Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro ^ 
20 25 30 

GAA GCC GTG GTT GAA GCC ACC CAA CAG TTT TAC AGT CTG AGC GCC GGA 744 
Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 

35 40 45 45 

AAC GTC CAT CGC AGC CAG TTT GCC GAA GCC CAA CGC CTG ACC GCG CGT 792 
Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 

50 55 60 50 

TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT GCA CCG GAT 840 
Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

GAT AAA ACT ATC GTC TGG ACG CGC GGC ACC ACT GAA TCC ATC AAC ATG 
Asp Lys Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 
85 90 95 



30 



35 



888 

60 
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GTG GCA CAA TGC TAT GCG CGT CCG CGT CTG CAA CCG GGC GAT GAG ATT 936 
val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 HO 

ATT GTC AGC GTG GCA GAA CAC CAC GCC AAC CTC GTC CCC TGG CTG ATG 984 
He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
H5 120 125 

GTC GCC CAA CAA ACT GGA GCC AAA GTG GTG AAA TTG CCG CTT AAT GCG 1032 
val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

CAG CGA CTG CCG GAT GTC GAT TTG TTG CCA GAA CTG ATT ACT CCC CGT 1080 
Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

AGT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT GGC GGT TGC 1128 
Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 
165 170 175 

CCG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC GGG ATG GTG 1176 
Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

GTG ATG GTT GAT GGT GCT CAG GGG GCA GTG CAT TTC CCC GCG GAT GTT 1224 
Val Met val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

35 CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC AAA CTG TAT 1272 
Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

GGC CCG ACA GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA CTG CTG GAG 1320 
Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC GAA GTG AGT 1368 
Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 
245 250 255 

TTT GAC GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG GAA GCT GGA 1416 
Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG CTG GAA TGG 1464 
Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala- Leu Glu Trp 
275 280 285 

CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC CGT AGC TTA 1512 
Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 



60 
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GCA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC TTT CGT TCA 1560 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT GCT GGC GTT 1608 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 330 335 

CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT ATT GCC CTG 1656 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly lie Ala Leu 
340 345 350 

CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA TTA GGC GTA 1704 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 

355 360 365 



5 



10 



15 



20 



ACC GGC ACA CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA AAG AGT GAT 17 52 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA TTA TTG GTG 1800 25 

Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

GAT TAAACGCGTG CTAGAGGCAT CAAATAAAAC GAAAGGCTCA GTCGAAAGAC 1853 30 

Asp 



TGGGCCTTTC 


GTTTTATCTG 


TTGTTTGTCG 


GTGAACGCTC 


TCCTGAGTAG 


GACAAATCCG 


1913 


35 


CCGCCCTAGA 


CCTAGGGGAT 


ATATTCCGCT 


TCCTCGCTCA 


CTGACTCGCT 


ACGCTCGGTC 


1973 




GTTCGACTGC 


GGCGAGCGGA 


AATGGCTTAC 


GAACGGGGCG 


GAGATTTCCT 


GGAAGATGCC 


2033 


40 


AGGAAGATAC 


TTAACAGGGA 


AGTGAGAGGG 


CCGCGGCAAA 


GCCGTTTTTC 


CATAGGCTCC 


2093 


GCCCCCCTGA 


CAAGCATCAC 


GAAATC TG AC 


GCTCAAATCA 


GTGGTGGCGA 


AACCCGACAG 


2153 




GACTATAAAG 


ATA C CAG GCG 


TTTCCCCCTG 


GCGGCTCCCT 


CGTGCGCTCT 


CCTGTTCCTG 


2213 


45 


CCTTTCGGTT 


TACCGGTGTC 


ATTCCGCTGT 


TATGGCCGCG 


TTTGTCTCAT 


TCCACGCCTG 


2273 




ACACTCAGTT 


CCGGGTAGGC 


AGTTCGCTCC 


AAGCTGGACT 


GTATGCACGA 


ACCCCCCGTT 


2333 


50 


CAGTCCGACC 


GCTGCGCCTT 


ATCCGGTAAC 


TATCGTCTTG 


AGTCCAACCC 


GGAAAGACAT 


2393 




GCAAAAGCAC 


CACTGGCAGC 


AGCCACTGGT 


AATTGATTTA 


GAGGAGTTAG 


TCTTGAAGTC 


2453 


55 


ATGCGCCGGT 


TAAGGCTAAA 


CTGAAAGGAC 


AAGTTTTGGT 


GACTGCGCTC 


CTCCAAGCCA 


2513 


GTTACCTCGG 


TTCAAAGAGT 


TGGTAGCTCA 


GAGAACCTTC 


GAAAAACCGC 


CCTGCAAGGC 


2573 




GGTTTTTTCG 


TTT TC AG AG C 


AAGAGATTAC 


GCGCAGACCA 


AAACGATCTC 


AAGAAGATCA 


2633 


60 


~TCTTATTAAT~ 


^AGATAAAATT 


"ATTTC TAG AT 


TTCAGTGCAA 


TTTATCTCTT 


CAAATGTAGC 


2693 





65 
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ACCTGAAGTC 


AGCCCCATAC 


GATATAAGTT 


GTTACTAGTG 


CTTGGATTCT 


CACCAATAAA 


2753 




AAACGCCCGG 


CGGCAACCGA 


GCGTTCTGAA 


CAAATCCAGA 


TGGAGTTCTG 


AGGTC AT TAC 


2813 


5 


TGGATCTATC 


AACAG GAGTC 


CAAGCGAGCT 


CTCGAACCCC 


AGAGTCCCGC 


TCAGAAGAAC 


2873 




TCGTCAAGAA 


GGCGATAGAA 


GGCGATGCGC 


TGCGAATCGG 


GAGCGGCGAT 


ACCGTAAAGC 


2933 


10 


ACGAGGAAGC 


GGTCAGCCCA 


TTCGCCGCCA 


AGCTCTTCAG 


CAATATCACG 


GGTAGCCAAC 


2993 




GCTATGTCCT 


GATAGCGGTC 


CGCCACACCC 


AGCCGGCCAC 


AGTCGATGAA 


TCCAGAAAAG 


3053 


15 


CGGCCATTTT 


CCACCATGAT 


ATTCGGCAAG 


CAGGCATCGC 


CATGGGTCAC 


GACGAGATCC 


3113 




TCGCCGTCGG 


GCATGCGCGC 


CTTGAGCCTG 


GCGAACAGTT 


CGGCTGGCGC 


GAGCCCCTGA 


3173 


20 


TGCTCTTCGT 


CCAGATCATC 


CTGATCGACA 


AGACCGGCTT 


CCATCCGAGT 


ACGTGCTCGC 


3233 


TCGATGCGAT 


GTTTCGCTTG 


GTGGTCGAAT 


GGGCAGGTAG 


CCGGATCAAG 


CGTATGCAGC 


3293 




CGCCGCATTG 


CATCAGCCAT 


GATGGATACT 


TTCTCGGCAG 


GAGCAAGGTG 


AGATGACAGG 


3353 


25 


AGATCCTGCC 


CCGGCACTTC 


GCCCAATAGC 


AGCCAGTCCC 


TTCCCGCTTC 


AGTGACAACG 


3413 




TCGAGCACAG 


CTGCGCAAGG 


AACGCCCGTC 


GTGGCCAGCC 


ACGATAGCCG 


CGCTGCCTCG 


3473 


30 


TCCTGCAGTT 


CATTCAGGGC 


ACCGGACAGG 


TCGGTCTTGA 


CAAAAAGAAC 


CGGGCGCCCC 


3533 




TGCGCTGACA 


GCCGGAACAC 


GGCGGCATCA 


GAGCAGCCGA 


TTGTCTGTTG 


TGCCCAGTCA 


3593 


35 


TAGCCGAATA 


GCCTCTCCAC 


CCAAGCGGCC 


GGAGAACCTG 


CGTGCAATCC 


ATCTTGTTCA 


3653 


ATCATGCGAA 


ACGATCCTCA 


TCCTGTCTCT 


TGATCAGATC 


TTGATCCCCT 


GCGCCATCAG 


3713 




ATCCTTGGCG 


GCAAGAAAGC 


CATC C AGTTT 


ACTTTGCAGG 


GCTTCCCAAC 


CTTACCAGAG 


3773 


40 


GGCGCCCCAG 


CTGGCAATTC 


C 








3794 



(2) INFORMATION ZU SEQ ID NO: 6: 

45 (i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 401 Aminosauren 

(B) ART: Amino sau re 
(D) TOPOLOGIE: linear 

50 . . • . 

-(ii) ART- DES MOLEKULS : "Protein - 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 

55 Met Asn val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
1 5 10 15 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
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Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 40 45 

Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

Asn Lys Thr He Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 

85 90 95 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 HO 

He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 
165 170 175 

Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 - 255 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 _300 



25 



35 



40 



45 



55 



60 



Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 
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Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 330 335 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
io 355 360 365 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 



15 



20 



Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

ASP 

(2) INFORMATION ZU SEQ ID NO: 7: 

25 (i) SEQUENZ CHARAKTERI STIKA : 

(A) LANGE: 3810 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

30 (D) TOPOLOGIE: ringformig 

(ii> ART DES MOLEKULS: DNS (genomisch) 

(iii) HYPOTHETISCH: NEIN 

35 

(iii) ANTISENSE: NEIN 

(vii) UNMITTELBARE HERKUNFT: 
40 (B) CLON: pHSlbioS2 

(ix> MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 608.. 1822 



45 



50 



55 



60 



(xi> SEQUENZBESCHREIBUNG: SEQ ID NO: 7: 
GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG 60 

AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAG CTAAAAC 120 

GGAGCTTTTT TGCCCTGCGT GAC CAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA 180 

AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA 2 40 

AGCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA AC AGTTGAAA CACAAACTTG 300 

AACAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA 3 60 

_ATGTCCTGAG-CAATCACCTA_TGAACTGTC^^ l20 - 
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15 



20 



AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC 480 

GGATAACAAT TTCACACACG CTAGCGGTAC CGGGCCCCCC CTCGAGGTCG ACGGTATCGA 540 

TAAGCTTGAT ATCGAATTCC TGCAGCCCGG GGGATCCCAT GGTACGCGTA AAGAGGAGAA 600 

ATTAACT ATG AAA TTA CCG ATT TAT CTC GAC TAC TCC GCA ACC ACG CCG 649 
Met Lys Leu Pro He Tyr Leu Asp Tyr Ser Ala Thr Thr Pro 
15 10 

GTG GAC CCG CGT GTT GCC GAG AAA ATG ATG CAG TTT ATG ACG ATG GAC 697 
val Asp Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp 
15 20 25 30 

GGA ACC TTT GGT AAC CCG GCC TCC CGT TCT CAC CGT TTC GGC TGG CAG 745 
Gly Thr Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin 
35 40 4o 

GCT GAA GAA GCG GTA GAT ATC GCC CGT AAT CAG ATT GCC GAT CTG GTC 793 
Ala Glu Glu Ala Val Asp He Ala Arg Asn Gin He Ala Asp Leu Val 

50 55 60 25 

GGC GCT GAT CCG CGT GAA ATC GTC TTT ACC TCT GGT GCA ACC GAA TCT 841 
Gly Ala Asp Pro Arg Glu He Val Phe Thr Ser Gly Ala Thr Glu Ser 

65 70 75 30 

GAC AAC CTG GCG ATC AAA GGT GCA GCC AAC TTT TAT CAG AAA AAA GGC 8 89 

Asp Asn Leu Ala He Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly 

80 85 90 35 

AAG CAC ATC ATC ACC AGC AAA ACC GAA CAC AAA GCG GTA CTG GAT ACC 9 37 

Lys His He He Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr 
95 100 105 HO 

TGC CGT CAG CTG GAG CGC GAA GGT TTT GAA GTC ACC TAC CTG GCA CCG 985 
Cys Arg Gin Leu Glu Arg Glu Gly Phe Glu val Thr Tyr Leu Ala Pro 
115 120 125 

CAG CGT AAC GGC ATT ATC GAC CTG AAA GAA CTT GAA GCA GCG ATG CGT 1033 
Gin Arg Asn Gly He He Asp Leu Lys Glu Leu Glu Ala Ala Met Arg 
130 135 140 

GAC GAC ACC_ ATC_CTC_ GTG TCC. ATC _ATG_CAC GTA AAT. AAC GAA„ ATC _ -GGC - .1.0.8.1. 50 

Asp Asp Thr He Leu Val Ser He Met His Val Asn Asn Glu He Gly 
145 150 155 

GTG GTG CAG GAT ATC GCG GCT ATC GGC GAA ATG TGC CGT GCT CGT GGC 1129 5 . s 

Val Val Gin Asp He Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly 
160 " 165 170 

ATT ATC TAT CAC GTT GAT GCA ACC CAG AGC GTG GGT AAA CTG CCT ATC 1177 ^ 

He He Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro He ^ 

175 _ r80 r85 190 
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GAC CTG AGC CAG TTG AAA GTT GAC CTG ATG TCT TTC TCC GGT CAC AAA 12 2d 

Asp Leu Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys 
195 200 205 

ATC TAT GGC CCG AAA GGT ATC GGT GCG CTG TAT GTA CGT CGT AAA CCG 127 3 

lie Tyr Gly Pro Lys Gly lie Gly Ala Leu Tyr Val Arg Arg Lys Pro 
210 215 220 

CGC GTA CGC ATC GAA GCG CAA ATG CAC GGC GGC GGT CAC GAG CGC GGT 1321 
Arg Val Arg lie Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly 
225 230 235 

ATG CGT TCC GGC ACT CTG CCT GTT CAC CAG ATC GTC GGA ATG GGC GAG 1369 
Met Arg Ser Gly Thr Leu Pro Val His Gin He Val Gly Met Gly Glu 
240 245 250 

GCC TAT CGC ATC GCA AAA GAA GAG ATG GCG ACC GAG ATG GAA CGT CTG 1417 
A"' a Tyr Arg He Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu 
255 260 265 270 

CGC GGC CTG CGT AAC CGT CTG TGG AAC GGC ATC AAA GAT ATC GAA GAA 1465 
Arg Gly Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp He Glu Glu 
275 280 285 

GTT TAC CTG AAC GGT GAC CTG GAA CAC GGT GCG CCG AAC ATT CTC AAC 1513 
Val Tyr Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn He Leu Asn 
290 295 300 

GTC AGC TTC AAC TAC GTT GAA GGT GAG TCG CTG ATT ATG GCG CTG AAA 1561 
Val Ser Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met Ala Leu Lys 
305 310 315 

GAC CTC GCA GTT TCT TCA GGT TCC GCC TGT ACG TCA GCA AGC CTC GAA 1609 
40 Asp Leu Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu 
320 325 330 

CCG TCC TAC GTG CTG CGC GCG CTG GGG CTG AAC GAC GAG CTG GCA CAT 16 57 

45 Pro Ser Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His 
335 340 345 350 

AGC TCT ATC CGT TTC TCT TTA GGT CGT TTT ACT ACT GAA GAA GAG ATC 17 05 

Ser Ser He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu He 
355 360 36 5 

GAC TAC ACC ATC GAG TTA GTT CGT AAA TCC ATC GGT CGT CTG CGT GAC 17 53 

Asp Tyr Thr He Glu Leu Val Arg Lys Ser He Gly Arg Leu Arg Asp 
370 375 380 

CTT TCT CCG CTG TGG GAA ATG TAC AAG CAG GGC GTG GAT CTG AAC AGC 1801 
Leu Ser Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser 
385 390 395 
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35 



50 



55 
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ATC GAA TGG GCT CAT CAT TAAACGC GTG CTAGAGGCAT CAAATAAAAC 1849 
He Glu Trp Ala His His 

400 405 

GAAAGGCTCA GTC GAAAGAC TGGGCCTTTC GTTTTATCTG TTGTTTGTCG GTGAACGCTC 1909 

TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT ATATTCCGCT TCCTCGCTCA 1969 

to 

CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA AATGGCTTAC GAACGGGGCG 2029 

GAG ATT TC CT GGAAGATGCC AGGAAGATAC TTAACAGGGA AGTGAGAGGG CCGCGGCAAA 2089 

GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC GAAATCTGAC GCTCAAATCA 2149 15 

GTGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG GCGGCTCCCT 2209 

CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC ATTCCGCTGT TATGGCCGCG 2269 ^ 

TTTGTCTCAT TCCACGCCTG ACACTCAGTT CCGGGTAGGC AGTTCGCTCC AAGCTGGACT 2329 

GTATGCACGA ACCCCCCGTT CAGTCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG 2389 

25 

AGTCCAACCC GGAAAGACAT GCAAAAGCAC CACTGGCAGC AGCCACTGGT AATTGATTTA 2449 

GAGGAGTTAG TCTTGAAGTC ATGCGCCGGT TAAGGCTAAA CTGAAAGGAC AAGTTTTGGT 2509 

GACTGCGCTC CTCCAAGCCA GTTACCTCGG TTCAAAGAGT TGGTAGC TC A GAGAACCTTC 2 569 30 

GAAAAACCGC CCTGCAAGGC GGTTTTTTCG TTTTCAGAGC AAGAGATTAC GCGCAGACCA 2629 

AAACGATCTC AAGAAGATCA TCTTATTAAT CAGATAAAAT ATTTCTAGAT TTCAGTGCAA 2689 

•TTTATCTCTT CAAATGTAGC ACCTGAAGTC AGCCCCATAC GATATAAGTT GTTAC TAGTG 2749 

CTTGGATTCT C AC C AAT AAA AAACGCCCGG CGGCAACCGA GCGTTCTGAA CAAATCCAGA 2 809 

TGGAGTTCTG AGGTCATTAC TGGATCTATC AACAGGAGTC CAAGCGAGCT CTCGAACCCC 2869 

AGAGTCCCGC TCAGAAGAAC TCGTCAAGAA GGCGATAGAA GGCGATGCGC TGCGAATCGG 2929 

GAGCGGCGAT ACCGTAAAGC ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA AGCTCTTCAG 2989 45 

CAATATCACG GGTAGCCAAC GCTATGTCCT GATAGCGGTC CGCCACACCC AGCCGGCCAC 3049 

AGTCGATGAA TCCAGAAAAG CGGCCATTTT CCACCATGAT ATTCGGCAAG CAGGCATCGC 3109 

CATGGGTCAC GACGAGATCC TCGCCGTCGG GCATGCGCGC CTTGAGCCTG GCGAACAGTT 3169 

CGGCTGGCGC GAGCCCCTGA TGCTCTTCGT C C AG ATC ATC CTGATCGACA AGACCGGCTT 3229 

CC ATCCGAGT ACGTGCTCGC TCGATGCGAT GTTTCGCTTG GTGGTC G AAT GGGCAGGTAG 3289 

CCGGATCAAG CGTATGCAGC CGCCGCATTG CATCAGCCAT GATGGATACT TTCTCGGCAG 3349 

GAGCAAGGTG AGATGACAGG AGATCCTGCC CCGGCACTTC GCCCAATAGC AGCCAGTCCC 3409 60 

"Tf CCCGCTTC AGTGAC AACG~TCGAGC^"AG~lZT^GCAAGG AACGCCCGTC GTGGCCAGCC 3"4"69 
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ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTC A GGGC ACCGGACAGG TCGGTCTTGA 3529 

CAAAAAGAAC CGGGCGCCCC TGCGCTGACA GCCGGAACAC GGCGGCATCA GAGCAGCCGA 3589 

TTGTCTGTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC CCAAGCGGCC G GAGAAC CTG 3649 

CGTGCAATCC ATCTTGTTCA ATCATGCGAA ACGATCCTCA TCCTGTCTCT TGATCAGATC 3709 

TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC CATCCAGTTT ACTTTGCAGG 3769 

GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC C 3810 

15 (2) INFORMATION ZU SEQ ID NO: 8: 

(i) SEQU3NZ CHARAKTERI STIKA : 
(A J LANGE: 4 04 Aminosauren 
(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 



10 



20 



<ii) ART DES MOLEKULS: Protein 

25 ( X i) SEQUENZBESCHREI3UNG: SEQ ID NO: 8: 

Met Lys Leu Pro He Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp 
1 5 10 15 

Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 
20 25 30 



30 



Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 

■35 35 40 45 

Glu Ala val Asp He Ala Arg Asn Gin He Ala Asp Leu Val Gly Ala 
50 55 60 

40 Asp Pro Arg Glu He Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
55 70 75 80 

Leu Ala He Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 
45 85 90 95 

He He Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 HO 

50 Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala- Pro Gin Arg 
115 120 125 

Asn Gly He He Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
ss 130 135 140 

Thr He Leu val Ser He Met His Val Asn Asn Glu He Gly Val Val 
145 150 155 160 

Gin Asp He Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly He He 
-165 170— 175 



60 
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Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro He Asp Leu 
180 185 190 

Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys He Tyr 
195 200 205 

Gly Pro Lys Gly lie Gly Ala Leu Tyr val Arg Arg Lys Pro Arg val 
210 215 220 

Arg He Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 

Ser Gly Thr Leu Pro Val His Gin He Val Gly Met Gly Glu Ala Tyr 
245 250 255 

Arg He Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly 
260 265 270 

Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp He Glu Glu Val Tyr 
275 280 285 

Leu Asn Gly Aso Leu Glu His Gly Ala Pro Asn He Leu Asn Val Ser 
290 295 300 

Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met Ala Leu Lys Asp Leu 

315 320 
305 310 J>xo 

Ala Val ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser 
325 330 335 

Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser 
340 345 350 

He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu He Asp Tyr 
355 360 365 

Thr- He Glu Leu Val Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser 
370 375 380 

Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser He Glu 
385 390 395 4 00 

Trp Ala His His 

(2) INFORMATION ZU SEQ ID MO: 9: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 3465 Basenpaare 

(B) ART: Nukleinsaure 



(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: ringformig 

(ii) ART DES MOLEKULS: DNS (genoraisch) 
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<iii) HYPOTHETISCH: NEIN 
(iii) ANT I SENSE : NEIN 

5 

(vii) UNMITTELBARE HERKUNFT: 
(B) CLON: pHS2bioSl 

10 (ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 
(3) LAGE: 272. . 1477 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 

GACGTCTAAG AAACCATTAT TATCATGACA TTAACCTATA AAAATAGGCG TATCAC GAGG 60 

CCCTTTCGTC TTCACCTCGA GTCCCTATCA GTGATAGAGA TTGACATCCC TATCAGTGAT 120 

20 AGAGATACTG AGCACATCAG CAGGACGCAC TGACCGAATT C A TT AAAG AG GAGAAAGGTA 180 

CCGGGCCCCC CCTCGAGGTC GACGGTATCG ATAAGCTTGA TATCGAATTC CTGCAGCCCG 240 

25 GGGGATCCCA TGGTACGCGT CGAGGAGTAC C ATG AAC GTT TTT AAT CCC GCG 292 

Met Asn val Phe Asn Pro Ala 
1 5 

30 CAG TTT CGC GCC CAG TTT CCC GCA CTA CAG GAT GCG GGC GTC TAT CTC 34 0 

Gin Phe Arg Ala Gin Phe Pro Ala Leu Gin Asp Ala Gly Val Tyr Leu 
10 15 20 

^ GAC AGC GCC GCG ACC GCG CTT AAA CCT GAA GCC GTG GTT GAA GCC ACC 388 
3 " Asp Ser Ala Ala Thr Ala Leu Lys Pro Glu Ala Val val Glu Ala Thr 
25 30 35 

CAA CAG TTT TAC AGT CTG AGC GCC GGA AAC GTC CAT CGC AGC CAG TTT 436 
40 Gin Gin Phe Tyr Ser Leu Ser Ala Gly Asn Val His Arg Ser Gin Phe 
40 45 50 55 

GCC GAA GCC CAA CGC CTG ACC GCG CGT TAT GAA GCT GCA CGA GAG AAA 484 
Ala Glu Ala Gin Arg Leu Thr Ala Arg Tyr Glu Ala Ala Arg Glu Lys 
60 65 70 

GTG GCG CAA TTA CTG AAT GCA CCG GAT GAT AAA ACT ATC GTC TGG ACG 532 
Val Ala Gin Leu Leu Asn Ala Pro Asp Asp Lys Thr He Val Trp Thr 

- 75 - - - 80 ~ " • 85 

CGC GGC ACC ACT GAA TCC ATC AAC ATG GTG GCA CAA TGC TAT GCG CGT 580 
Arg Gly Thr Thr Glu Ser He Asn Met Val Ala Gin Cys Tyr Ala Arg 
90 95 100 

CCG CGT CTG CAA CCG GGC GAT GAG ATT ATT GTC AGC GTG GCA GAA CAC 6 28 

Pro Arg Leu Gin Pro Gly Asp Glu He He Val Ser Val Ala Glu His 
60 io5 HO H5 
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CAC GCC AAC CTC GTC CCC TGG CTG ATG GTC GCC CAA CAA ACT GGA GCC 676 

His Ala Asn Leu Val Pro Trp Leu Met Val Ala Gin Gin Thr Gly Ala 

120 125 130 135 $ 

AAA GTG GTG AAA TTG CCG CTT AAT GCG CAG CGA CTG CCG GAT GTC GAT 724 
Lys val Val Lys Leu Pro Leu Asn Ala Gin Arg Leu Pro Asp Val Asp 
140 145 150 

10 

TTG TTG CCA GAA CTG ATT ACT CCC CGT AGT CGG ATT CTG GCG TTG GGT 772 
Leu Leu Pro Glu Leu He Thr Pro Arg Ser Arg He Leu Ala Leu Gly 
155 160 165 

15 

CAG ATG TCG AAC GTT ACT GGC GGT TGC CCG GAT CTG GCG CGA GCG ATT 820 
Gin Met Ser Asn Val Thr Gly Gly Cys Pro Asp Leu Ala Arg Ala He 
170 175 180 

ACC TTT GCT CAT TCA GCC GGG ATG GTG GTG ATG GTT GAT GGT GCT CAG B68 
Thr Phe Ala His Ser Ala Gly Met Val Val Met Val Asp Gly Ala Gin 
185 190 195 

GGG GCA GTG CAT TTC CCC GCG GAT GTT CAG CAA CTG GAT ATT GAT TTC 916 25 

Gly Ala Val His Phe Pro Ala Asp Val Gin Gin Leu Asp lie Asp Phe 
200 205 210 215 

TAT GCT TTT TCA GGT CAC AAA CTG TAT GGC CCG ACA GGT ATC GGC GTG 964 30 

Tyr Ala Phe Ser Gly His Lys Leu Tyr Gly Pro Thr Gly He Gly Val 
220 225 230 

CTG TAT GGT AAA TCA GAA CTG CTG GAG GCG ATG TCG CCC TGG CTG GGC 1012 ^ 

Leu Tyr Gly Lys Ser Glu Leu Leu Glu Ala Met Ser Pro Trp Leu Gly 
235 240 245 



GGC GGC AAA ATG GTT CAC GAA GTG AGT TTT GAC GGC TTC ACG ACT CAA 1060 
Gly Gly Lys Met Val His Glu Val Ser Phe Asp Gly Phe Thr Thr Gin 
250 255 260 

TCT GCG CCG TGG AAA CTG GAA GCT GGA ACG CCA AAT GTC GCT GGT GTC 1108 
Ser Ala Pro Trp Lys Leu Glu Ala Gly Thr Pro Asn Val Ala Gly Val 
265 270 275 

ATA GGA TTA AGC GCG GCG CTG GAA TGG CTG GCA GAT TAC GAT ATC AAC 1156 
He Gly Leu Ser Ala Ala Leu Glu Trp Leu Ala Asp Tyr Asp He Asn 
280 285 290 255 

CAG GCC GAA AGC TGG AGC CGT AGC TTA GCA ACG CTG GCG GAA GAT GCG 12 04 

Gin Ala Glu Ser Trp Ser Arg Ser Leu Ala Thr Leu Ala Glu Asp Ala 
300 305 310 
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CTG GCG AAA CGT CCC GGC TTT CGT TCA TTC CGC TGC CAG GAT TCC AGC 1252 
Leu Ala Lys Arg Pro Gly Phe Arg Ser Phe Arg Cys Gin Asp Ser Ser 

315 320 325 60 
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10 



15 



20 



25 



CTG CTG GCC TTT GAT TTT GCT GGC GTT CAT CAT AGC GAT ATG GTG ACG 1300 
Leu Leu Ala Phe Asp Phe Ala Gly Val His His Ser Asp Met val Thr 
330 335 340 

CTG CTG GCG GAG TAC GGT ATT GCC CTG CGG GCC GGG CAG CAT TGC GCT 1348 
Leu Leu Ala Glu Tyr Gly He Ala Leu Arg Ala Gly Gin His Cys Ala 
345 350 355 

CAG CCG CTA CTG GCA GAA TTA GGC GTA ACC GGC ACA CTG CGC GCC TCT 1396 
Gin Pro Leu Leu Ala Glu Leu Gly Val Thr Gly Thr Leu Arg Ala Ser 
360 365 370 375 

TTT GCG CCA TAT AAT ACA AAG AGT GAT GTG GAT GCG CTG GTG AAT GCC 1444 
Phe Ala Pro Tyr Asn Thr Lys Ser Asp Val Asp Ala Leu Val Asn Ala 
380 385 390 

GTT GAC CGC GCG CTG GAA TTA TTG GTG GAT TAAACGCGTG CTAGAGGCAT 1494 
val Asp Arg Ala Leu Glu Leu Leu val Asp 
395 400 



CAAATAAAAC GAAAGGCTCA GTCGAAAGAC TGGGCCTTTC GTTTTATCTG TTGTTTGTCG 1554 

GTGAACGCTC TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT ATATTCCGCT 1614 

30 TCCTCGCTCA CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA AATGGCTTAC 1674 

GAACGGGGCG GAGATTTCCT GGAAGATGCC AGGAAGATAC TTAACAGGGA AGTGAGAGGG 1734 

CCGCGGCAAA GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC GAAATCTGAC 1794 

35 

GCTCAAATCA GTGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG 1854 

GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC ATTCCGCTGT 1914 

40 TATGGCCGCG TTTGTCTCAT TCCACGCCTG ACACTCAGTT CCGGGTAGGC AGTTCGCTCC 1974 

AAGCTGGACT GTATGCACGA ACCCCCCGTT CAGTCCGACC GCTGCGCCTT ATCCGGTAAC 2034 

« TATCGTCTTG AGTCCAACCC GGAAAGACAT GCAAAAGCAC CACTGGCAGC AGCCACTGGT 2094 

AATTGATTTA GAGGAGTTAG TCTTGAAGTC ATGCGCCGGT TAAGGCTAAA CTGAAAGGAC 2154 

AAGTTTTGGT GACTGCGCTC CTCCAAGCCA GTTACCTCGG TTCAAAC-AGT TGGTAGCTCA 2214 

50 

GAGAACCTTC GAAAAACCGC CCTGCAAGGC GGTTTTTTCG TTTTCAGAGC AAGAGATTAC 22 74 
GC GC AG ACC A AAACGATCTC AAC-AAGATCA TCTTATTAAT CAGATAAAAT ATTTC TAGAT 23 34 
" W TTCAGTGCAA TTTATCTCTT CAAATGTAGC ACCTGAAGTC AGCCCCATAC GATATAAGTT 23 94 
GTTACTAGTG CTTGGATTCT CACCAATAAA AAACGCCCGG CGGCAACCGA GCGTTCTGAA 24 54 
60 CAAATCCAGA TGGAGTTCTG AGGTCATTAC TGGATCTATC AACAGGAGTC CAAGCGAGCT 2514 
CTCGATiCCCC-AGAGTCCCGC-TCAGAAGAAC-TCGTCAAGAA-GGCGATAGAA-GGCGATGCGC 2574- 



65 



34 



DE 197 31 274 A L 

TGCGAATCGG GAGCGGCGAT ACCGTAAAGC ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA 2634 

AGCTCTTCAG CAATATCACG GGTAGCCAAC GCTATGTCCT GATAGCGGTC CGCCACACCC 2694 

AGCCGGCCAC AGTCGATGAA TCCAGAAAAG CGGCCATTTT CCACCATGAT ATTCGGCAAG 27 54 

CAGGCATCGC CATGGGTCAC GACGAGATCC TCGCCGTCGG GCATGCGCGC CTTGAGCCTG 2814 

GCGAACAGTT CGGCTGGCGC GAGCCCCTGA TGCTCTTCGT CCAGATCATC CTGATCGACA 2874 

AGACCGGCTT CCATCCGAGT ACGTGCTCGC TCGATGCGAT GTTTCGCTTG GTGGTCGAAT 2934 

GGGCAC-GTAG CCGGATCAAG CGTATGCAGC CGCCGCATTG CATCAGCCAT GATGGATACT 2994 15 

TTCTCGGCAG GAGCAAGGTG AGATGACAGG AGATCCTGCC CCGGCACTTC GCCCAATAGC 3054 

AGCCAGTCCC TTCCCGCTTC AGTGACAACG TC GAGC AC AG CTGCGCAAGG AACGCCCGTC 3114 ^ 

GTGGCCAGCC ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTCAGGGC ACCGGACAGG 3174 

<n C GGTCTTGA CAAAAAGAAC CGGGCGCCCC TGCGCTGACA GCCGGAACAC GGCGGCATCA 3234 

25 

GAGCAGCCGA TTGTCTCTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC CCAAGCGGCC 3294 

GGAGAACCTG CGTGCAATCC ATCTTGTTCA ATCATGCGAA ACGATCCTCA TCCTGTCTCT 33 54 

TGATCAGATC TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC CATCCAGTTT 3414 30 

ACTTTGCAGG GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC C 3465 

(2) INFORMATION ZU SEQ ID NO: 10: 35 

(i) SEQUENZ CHARAKTE R I ST I KA : 
(A) LANGE: 401 Aminosauren 
( 3 ) ART : Aminosaure 
(D) TOPOLOGIE: linear 



40 



45 



50 



(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

Met Asn val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
15 10 15 

Gin Asp Ala- G-ly- Val Tyr -Leu- Asp Ser Ala .Ala. Thr Ala _Leu Lys .Pro 
20 25 30 

Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 

35 40 45 55 

Asn val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
_ 55 70 75 80 
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Asp Lys Thr He Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 
85 90 95 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 HO 

He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
H5 120 125 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 
165 170 175 

Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

Val Met val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 
245 250 255 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 330 335 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 



Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 
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Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

Asp 



10 



(2) INFORMATION ZU SEQ ID NO: 11: 

(i) SEQDENZ CHARAKTERISTIKA: 

(A) LANGE: 34 81 Basenpaare 
(3) ART: Nukleinsaure 

{C> STRANG FORM : Einzel 
(D) TOPOLOGIE: ringformig 

(ii) ART DES MOLEKULS : DNS (genomisch) 

(iii) HYPOTHETISCH: NEIN 

(iii) ANTI SENSE: NEIN 

(vii) UNMI TTELBARE HERKUNFT: 

(B) CLON: pHS2bioS2 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 279. .1493 

(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

GACGTCTAAG AAACCATTAT TATCATGACA TTAACCTATA AAAATAGGCG TATCACGAGG 

CCCTTTCGTC TTCACCTCGA GTCCCTATCA GTGATAGAGA TTGACATCCC TATCAGTGAT 

AGAGATACTG AGCACATCAG CAGGACGCAC TGACCGAATT CATTAAAGAG GAGAAAGGTA 

CCGGGCCCCC CCTCGAGGTC G AC GGTATCG ATAAGCTTGA TATCGAATTC CTGCAGCCCG 

GGGGATCCCA TGGTACGCGT AAAGAGGAGA AATTAACT ATG AAA TTA CCG ATT 

Met Lys Leu Pro lie 
1 5 

TAT CTC GAC TAC TCC GCA ACC ACG CCG GTG GAC CCG CGT GTT GCC GAG 
Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp Pro Arg Val Ala Glu 
10 15 20 

AAA ATG ATG CAG TTT ATG ACG ATG GAC GGA ACC TTT GGT AAC CCG GCC 
Lys Met Met Gin Phe Met Thr Met Asp Gly Thr Phe Gly Asn Pro Ala 
25 30 35 
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389 
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120 
180 

240 45 
293 
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TCC CGT TCT CAC CGT TTC GGC TGG CAG GCT GAA GAA GCG GTA GAT ATC 437 
Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu Glu Ala val Asp He 
40 45 50 

GCC CGT AAT CAG ATT GCC GAT CTG GTC GGC GCT GAT CCG CGT GAA ATC 485 
Ala Arg Asn Gin lie Ala Asp Leu Val Gly Ala Asp Pro Arg Glu He 
55 60 65 

GTC TTT ACC TCT GGT GCA ACC GAA TCT GAC AAC CTG GCG ATC AAA GGT 533 
Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn Leu Ala He Lys Gly 
70 75 80 85 

GCA GCC AAC TTT TAT CAG AAA AAA GGC AAG CAC ATC ATC ACC AGC AAA 581 
Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His He He Thr Ser Lys 
90 95 100 

ACC GAA CAC AAA GCG GTA CTG GAT ACC TGC CGT CAG CTG GAG CGC GAA 629 
Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg Gin Leu Glu Arg Glu 
105 110 115 

25 GGT TTT GAA GTC ACC xaC CTG GCA CCG CAG CGT AAC GGC ATT ATC GAC 677 
Gly Phe Glu val Thr Tyr Leu Ala Pro Gin Arg Asn Gly He He Asp 
120 125 130 
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CTG AAA GAA CTT GAA GCA GCG ATG CGT GAC GAC ACC ATC CTC GTG TCC 725 
Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp Thr He Leu Val Ser 
135 140 145 

ATC ATG CAC GTA AAT AAC GAA ATC GGC GTG GTG CAG GAT ATC GCG GCT 773 
He Met His Val Asn Asn Glu He Gly Val Val Gin Asp He Ala Ala 
150 155 160 165 

ATC GGC GAA ATG TGC CGT GCT CGT GGC ATT ATC TAT CAC GTT GAT GCA 821 
He Gly Glu Met Cys Arg Ala Arg Gly He He Tyr His Val Asp Ala 
170 175 180 

ACC CAG AGC GTG GGT AAA CTG CCT ATC GAC CTG AGC CAG TTG AAA GTT 869 
Thr Gin Ser Val Gly Lys Leu Pro He Asp Leu Ser Gin Leu Lys Val 
185 190 195 

GAC CTG ATG TCT TTC TCC GGT CAC AAA ATC TAT GGC CCG AAA GGT ATC 917 
Asp Leu Met Ser Phe Ser Gly His Lys He Tyr Gly Pro Lys Gly He 
200 205 210 

GGT GCG CTG TAT GTA CGT CGT AAA CCG CGC GTA CGC ATC GAA GCG CAA 965 
Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val Arg He Glu Ala Gin 
215 220 225 



ATG CAC GGC GGC GGT CAC GAG CGC GGT ATG CGT TCC GGC ACT CTG CCT 1013 
Met His Gly Gly Gly His Glu Arg Gly Met Arg Ser Gly Thr Leu Pro 
60 230 235 240 245 
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1061 



1109 



1157 



1205 



1253 



GTT CAC CAG ATC GTC GGA ATG GGC GAG GCC TAT CGC ATC GCA AAA GAA 
Val His Gin lie val Gly Met Gly Glu Ala Tyr Arg He Ala Lys Glu 
250 255 260 

GAG ATG GCG ACC GAG ATG GAA CGT CTG CGC GGC CTG CGT AAC CGT CTG 
Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly Leu Arg Asn Arg Leu 
265 270 275 

TGG AAC GGC ATC AAA GAT ATC GAA GAA GTT TAC CTG AAC GGT GAC CTG 
Trp Asn Gly He Lys Asp He Glu Glu Val Tyr Leu Asn Gly Asp Leu 
280 285 290 

GAA CAC GGT GCG CCG AAC ATT CTC AAC GTC AGC TTC AAC TAC GTT GAA 
Glu His Gly Ala Pro Asn He Leu Asn Val Ser Phe Asn Tyr Val Glu 
295 300 305 

GGT GAG TCG CTG ATT ATG GCG CTG AAA GAC CTC GCA GTT TCT TCA GGT 
Gly Glu Ser Leu He Met Ala Leu Lys Asp Leu Ala Val Ser Ser Gly 
310 315 320 325 

TCC GCC TGT ACG TCA GCA AGC CTC GAA CCG TCC TAC GTG CTG CGC GCG 1301 
Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser Tyr Val Leu Arg Ala 
330 335 340 

CTG GGG CTG AAC GAC GAG CTG GCA CAT AGC TCT ATC CGT TTC TCT TTA 1349 
Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser He Arg Phe Ser Leu 
345 350 355 

GGT CGT TTT ACT ACT GAA GAA GAG ATC GAC TAC ACC ATC GAG TTA GTT 1397 
Gly Arg Phe Thr Thr Glu Glu Glu He Asp Tyr Thr He Glu Leu Val 
360 365 370 

CGT AAA TCC ATC GGT CGT CTG CGT GAC CTT TCT CCG CTG TGG GAA ATG 1445 
Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser Pro Leu Trp Glu Met 
375 380 385 

TAC AAG CAG GGC GTG GAT CTG AAC AGC ATC GAA TGG GCT CAT CAT TAAACGCGTG 15 00 
Tyr Lys Gin Gly Val Asp Leu Asn Ser He Glu Trp Ala His His 
390 395 400 405 



CTAGAGGCAT 


CAAATAAAAC 


GAAAGGCTCA 


GTCGAAAGAC 


TGGGCCTTTC 


GTTTTATCTG 


1560 


TTGTTTGTCG 


GTGAACGCTC 


TCCTGAGTAG 


GACAAATCCG 


CCGCCCTAGA 


CCTAGGGGAT 


1620 


ATATTCCGCT. 


JTCCTCGCTCA. 


CTGACTCGCT 


ACGCTCGGTC 


_GTTCG ACTGC 


GGCGAGCGGA. 


1680 _ 


AATGGCTTAC 


GAACGGGGCG 


GAGATTTCCT 


GGAAGATGCC 


AGGAAGATAC 


TTAACAGGGA 


1740 


AGTGAGAGGG 


CCGCGGCAAA 


GCCGTTTTTC 


CATAGGCTCC 


GCCCCCCTGA 


CAAGCATCAC 


1800 


GAAATCTGAC 


G CTC AAA TCA 


GTGGTGGCGA 


AACCCGACAG 


GACTATAAAG 


ATACCAGGCG 


1860 


TTTCCCCCTG 


GCGGCTCCCT 


CGTGCGCTCT 


CCTGTTCCTG 


CCTTTCGGTT 


TACCGGTGTC 


1920 
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ATTCCGCTGT 


TATGGCCGCG 


TTTGTCTCAT 


TCCACGCCTG 


ACACTCAGTT 


CCGGGTAGGC 


1980 




AGTTCGCTCC 


AAGCTGGACT 


GTATGCACGA 


ACCCCCCGTT 


CAGTCCGACC 


GCTGCGCCT'T 


204C 


5 


ATCCGGTAAC 


TATCGTCTTG 


AGTCCAACCC 


GGAAAGACAT 


GCAAAAGCAC 


CACTGGCAGC 


2100 




AGCCACTGGT 


AATTGATTTA 


GAGGAGTTAG 


TCTTGAAGTC 


ATGCGCCGGT 


TAAGGCTAAA 


2160 


10 


CTGAAAGGAC 


AAGTTTTGGT 


GACTGCGCTC 


CTCCAAGCCA 


GTTACCTCGG 


TTCAAAGAGT 


2220 




TGGTAGCTCA 


GAGAACCTTC 


GAAAAACCGC 


CCTGCAAGGC 


GGTTTTTTCG 


TTTTCAGAGC 


2280 


15 


AAGAGATTAC 


GCGCAGACCA 


AAACGATCTC 


AAGAAGATCA 


TCTTATTAAT 


CAGATAAAAT 


2340 




ATTTCTAGAT 


TTCAGTGCAA 


TTTATCTCTT 


CAAATGTAGC 


ACCTGAAGTC 


AGCCCCATAC 


2400 


20 


GATATAAGTT 


GTTACTAGTG 


CTTGGATTCT 


CACCAATAAA 


AAACGCCCGG 


CGGCAACCGA 


2460 




GCGTTCTGAA 


CAAATCCAGA 


TGGAGTTCTG 


AGGTCATTAC 


TGGATCTATC 


AACAGGAGTC 


2520 




CAAGCGAGCT 


CTCGAACCCC 


AGAGTCCCGC 


TCAGAAGAAC 


TCGTCAAGAA 


GGCGATAGAA 


2580 


25 


GGCGATGCGC 


TGCGAATCGG 


GAGCGGCGAT 


ACCGTAAAGC 


ACGAGGAAGC 


GGTCAGCCCA 


2640 




TTCGCCGCCA 


AGCTCTTCAG 


CAATATCACG 


GGTAGCCAAC 


GCTATGTCCT 


GATAGCGGTC 


2700 


30 


CGCCACACCC 


AGCCGGCCAC 


AGTCGATGAA 


TCCAGAAAAG 


CGGCCATTTT 


CCACCATGAT 


2760 




ATTCGGCAAG 


CAGGCATCGC 


CATGGGTCAC 


GACGAGATCC 


TCGCCGTCGG 


GCATGCGCGC 


2820 


35 


CTTGAGCCTG 


GCGAACAGTT 


CGGCTGGCGC 


GAGCCCCTGA 


TGCTCTTCGT 


CCAGATCATC 


2880 


CTGATCGACA 


AGACCGGCTT 


CCATCCGAGT 


ACGTGCTCGC 


TCGATGCGAT 


GTTTCGCTTG 


2940 




GTGGTC GAAT 


GGGCAGGTAG 


CCGGATCAAG 


CGTATGCAGC 


CGCCGCATTG 


CATCAGCCAT 


3000 


40 


GATGGATACT 


TTCTCGGCAG 


GAGCAAGGTG 


AGATGACAGG 


AGATCCTGCC 


CCGGCACTTC 


3060 . 




GCCCAATAGC 


AGCCAGTCCC 


TTCCCGCTTC 


AGTGACAACG 


TCGAGCACAG 


CTGCGCAAGG 


3120 


45 


AACGCCCGTC 


GTGGCCAGCC 


ACGATAGCCG 


CGCTGCCTCG 


TCCTGCAGTT 


CATTCAC-GGC 


3180 




ACCGGACAGG 


TCGGTCTTGA 


CAAAAAGAAC 


CGGGCGCCCC 


TGCGCTGACA 


GCCGGAACAC 


3240 


50 


GGCGGCATCA 


GAGCAGCCGA 


TTGTCTGTTG 


TGCCCAGTCA 


TAGCC GAAT A 


GCCTCTCCAC 


3300 


CGAAGCGGCC 


GGAGAAGCTG 


CGTGCAATCC 


ATCTTGTTCA ATCATGCGAA ACGATCCTCA 


"3360 




TCCTGTCTCT 


TGATCAGATC 


TTGATCCCCT 


GCGCCATCAG 


ATCCTTGGCG 


GCAAGAAAGC 


3420 


55 


CATC GAGTTT 
C 


ACTTTGCAGG 


GCTTCCCAAC 


CTTACCAGAG 


GGCGCCCCAG 


CTGGCAATTC 


3480 
3481 



(2) INFORMATION ZU SEQ ID NO: 12: 
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(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE : 4 04 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 

Met Lys Leu Pro He Tyr Leu Asp Tyr Ser Ala Thr Thr Pro val Asp 
15 10 15 

Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 
20 25 30 

Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 
35 40 45 

Glu Ala Val Asp He Ala Arg Asn Gin He Ala Asp Leu Val Gly Ala 
50 55 60 

Asp Pro Arg Glu He Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
65 70 75 80 

Leu Ala He Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 

85 90 95 

He He Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 HO 

Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 

Asn Gly He He Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 

Thr He Leu Val Ser He Met His Val Asn Asn Glu He Gly Val Val 
145 150 155 160 

Gin Asp He Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly He He 
165 170 175 

Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro He Asp Leu 
180 185 190 

Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly Kis Lys He Tyr 
195 200 205 

Gly Pro Lys Gly He Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val 

210 215 220 

Arg He Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 
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Ser Gly Thr Leu Pro 
245 

Arg lie Ala Lys Glu 
260 

Leu Arg Asn Arg Leu 
275 

Leu Asn Gly Asp Leu 
290 

Phe Asn Tyr Val Glu 
305 

Ala Val Ser Ser Gly 
325 

Tyr Val Leu Arg Ala 
340 

lie Arg Phe Ser Leu 
355 

Thr lie Glu Leu Val 
370 

Pro Leu Trp Glu Met 
385 

Trp Ala His His 



Val His Gin lie Val Gly 
250 

Glu Met Ala Thr Glu Met 
265 

Trp Asn Gly lie Lys Asp 
280 

Glu His Gly Ala Pro Asn 
295 

Gly Glu Ser Leu lie Met 
310 315 

Ser Ala Cys Thr Ser Ala 
330 

Leu Gly Leu Asn Asp Glu 
345 

Gly Arg Phe Thr Thr Glu 
360 

Arg Lys Ser lie Gly Arg 
375 

Tyr Lys Gin Gly Val Asp 
390 395 



Met Gly Glu Ala Tyr 
255 

Glu Arg Leu Arg Gly 
270 

He Glu Glu Val Tyr 
285 

He Leu Asn Val Ser 
300 

Ala Leu Lys Asp Leu 
320 

Ser Leu Glu Pro Ser 
335 

Leu Ala His Ser Ser 
350 

Glu Glu He Asp Tyr 
365 

Leu Arg Asp Leu Ser 
380 

Leu Asn Ser lie Glu 
400 



Patenlansprliche 

1. Verfahren zur Herslellung von Biotin, dadurch gekennzeichnet, daft man ein Biotingen mil der Sequenz SEQ 
ID No. 1 oder SEQ TD No. 3 sowie seine funktionellen Varianten, Analoge oder Derivate in einem prokaryontischen 
oder eukaryontischen Wirtsorganismus, der in der Lage ist. Biotin zu synlhetisieren, exprimiert, diesen ziichlet und 
das synthetisierte Biotin direkt, nach Abtrennung derBiomasse oder nach Reinigung des Biotins verwendet 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daB die Expression der Biotingene nach Anspruch 1 zu ei- 
ner gesleigerten Uinwandlung von Dethiobiolin in Biolin fuhrt. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB es sich bei den Varianten um Gene handelt, die 
auf der von den Scqucnzcn nach Anspruch 1 abgclcitctcn Aminosaurccbcnc cine Homologic von 40 bis 100% auf- 
weisen und cine gesteigerte Biotinsynthese ermoglichen. 

4. Verfahren nach den Anspriichen 1 bis 3, dadurch gekennzeichnet, daB als Wirlsorganismus ein Organismus aus- 
gewahlt aus der Gruppe der Gattungen Escherichia, Citrobacter, Serratia, Klebsiella, Salmonella. Pseudomonas, 
Comamonas. Acinetobacter, Azotobacter, Chromobacterium, Bacillus, Clostridium, Arthrobacter, Corynebacte- 
rium. Brevi bacterium. Eactococcus. Lactobacillus, Streptomyces. Rhizobiuni, Agrobacterium. Staphylococcus, 
Rhodotorula, Sprorobolomyces, Yarrowia, Schizosaccharomyces oder Saccharomyces verwendet wird. 

5. Verfahren nach den Anspriichen 1 bis 4, dadurch gekennzeichnet, daB als Wirtsorganismus eine regulationsde- 
fekte Biotinniuiante verwendet wird. 

6. Verfahren nach den Anspriichen 1 bis 5, dadurch gekennzeichnet, daB die Expression rnindestens einer Kopie der 
Biot ingcnc nach Anspruch 1 allcin oder mil einer oder mchrcrcn Kopicn rnindestens cincs wcitcrcn Biotingcns aus- 
gcwafilt aus dcFGruppc bio7V7bioB7bio] j 7bioCrbioD7bioHrbiolVbioW,~bio prokary^ 
ontischen oder eukaryontischen Wirtsorganismus erfolgf. 

7. Genkonsirukt enihaltend ein Biotingen mil der SEQ ID No. 1 oder SEQ ID No. 3, sowie seine funktionellen Va- 
rianten, Analoge oder Derivate, das mil einem oder mehreren Regulationssignalen zur Erhohung der Genexpression 
und/oder Proteinexpression funktionell verkniipft ist und/oder dessen natiirliche Regulation ausgeschaltet wurde. 

8. Genkonstrukt nach Anspruch 7, dadurch gekennzeichnet. daB es in einem Vektor inseriert wurde, der fur die Ex- 
pression des Gens in einem prokaryontischen oder eukaryontischen Wirtsorganismus geeignet ist. 
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9. Genkonsirukt nach Anspruch 7 oder 8, dadurch gekennzeichnet, daB die Biotingene nach Anspruch 7 in einer 
oder niehreren Kopien zusanimcn mil einer oder mehreren Kopien mindesiens eines weiteren Gens ausgcwahlt aus 
der Gruppe bioA, bioB, bioF. bioC. bioD, bioH, bioR bioW, bioX, bioY oder bioR im Vektor vorliegt. 

10. Organismen enihaliend ein Genkonsirukl gemaB den Anspruchen 7 bis 9. 

11. Verwendung einer Sequenz geinaB Anspruch 1 zur Herslellung von Biotin. 

12. Verwendung cincs Gcnkonsirukts gcniaB den Anspriichcn 7 bis 9 zur Hcrstcllung von Biotin. 
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2EICHNUNGEN SEITE 1 



Figur 1 



Nummer: 
Int. CI. 6 : 

Offenlegungstag: 



DE197 31 274 A1 
C12N 15/63 

28. Januar 1999 



1 Aatll 



Bglll 3689 
Bel I 3684 
Eag I 3619 
Drd I 3498 
Bal I 3445 
TthH1 I 3407 



BsaAl 3223 

Sph I 3124 
Nae I 3025 
Avail 3010 
Rsrll 3009 



Sac! 2839 
Sac I 2839 

Spe I 2727 

Xbal 2657 
Sspl 2651 
Asel 2638 
Sfu! 2551 
BstBI 2551 





3794 base pairs 
Unique Sites 




428 Aocl 
447 Eco47 111 
500 Nhel 
506 Asp718 
506 Kpn I 
536 Cla I 
542 HinD II! 
554 EcoR I 
566 Smal 
566 Xmal 
572 BamH I 
589 Mlu I 



357" Draili 




Avrll 1924 



1873 
Mlu I 



802 064/203 



ZEICHNUNGEN SEITE 2 



Figur 2 



Nummer 
Int. CI. 6 : 

Offenlegungstag: 



DE197 31 274 A1 
C12N 15/63 

28. Januar 1999 



1 Aatil 
23 SspHI 
68 Bbvll 

177 Asp718 
177 Kpnl 
183 Apal 
183 iApa I 
198 Accl 
198 Sail 
207 Clal 

Bgl II 3360 213 HinD III 

Bci I 3355 237 Sma I 




802 064/203 



ZEICHNUNGEN SEITE 3 Nummer: DE 197 31 274 A1 

Int. CI. 6 : C 12 N 15/63 

Offenlegungstag: 28. Januar 1999 



Figur 3 



1 Aatll 
23 BspH! 
68 Bbvl 



Xcmi 3394 
Bgfli 3376 
Bel I 3371 
Eag I 3306 
Drdl 3185 
Bai i 3132 \ Ll 

Fspl 3112 
Tth111 I 3094 



177 Asp718 
177 Kpnl 
183 Apal 
183 iApa ! 
198 Accl 
198 Sal I 
207 Clal 
213 HinD III 
237 Smal 
237 Xma I 
243 BamHi 
313 BstX! 
316 SgrAI 



Sph I 2811 



Nael 2712 
Rsrll 2696 



iSacI 2526 
Saci 2526 

Spel_2414 

Xbai 2344 
Sspl 2338 
Asel 2325 
Sful 2238 
BstB I 2238 

AlwN I 2100 




618 Gsu I 



— 824 PflMI 

870 Earn 11051 
947 Sp! I 



1039 Stu I 



1495 Mlu I 



Age! 1912 

Sac I! 1751 



1611 Avrl! 



802 064/203 



ZEICHNUNGEN SEITE 4 Nummer DE197 31 274 A1 

Int. CI. 6 : C12N 15/63 

Offenlegungstag: 28. Januar 1999 



Figur 4 



1 Aatll 



Xcm! 3723 
Bglll 3705 
Bel I 3700 
Eagi 3635 
Drdl 3514 
Bal i 3461 4 jj_ 



Tth1 



Sph I 3140 



Nael 3041 
Rsrll 3025 



iSac I 2855 
Sac I 2855 
Spe I 2743 

Xbal 2673 
Sspl 2667 
Asel 2654 
Sfu I 2567 
BstB I 2567 
AiwN 




pHSl bioS2 



+ 



3810 base pairs 
Unique Sites 



Hgal 2137 
Sac II 2080 
Avr II 




428 AocI 
447 Eco47iil 
500 Nhe I 
506 Asp718 
506 Kpn I 
536 Cla I 
542 HinDII! 
EcoRI 
Sma I 
Xma! 
BamH ! 
642 BstX I 
645 SgrAI 



\ 1824 Mlu 



_ 947 Gsu I 



1153 PflMI 
1199 Earn 11051 



1368 



1276 Spl I 
Stu I 



1940 



802 064/203 



